O que é uma correlação?
idade <- c(21, 46, 55, 35, 28)
renda <- c(1850, 2500, 2560, 2230, 1800)
data <- data.frame(idade, renda)
plot(data, pch = 16)
cor.plot(data) #função criada para o exemplo. Não é um comando base do R.
A correlação é positiva porque quase todos os pontos estão nos quadrantes azuis.
Correlação e regressão linear
library(wooldridge)
data("wage1") # ?wage1 para ver o conjunto de variáveis
library(tidyverse)
wage1a <- wage1 %>% select (wage, educ, exper, expersq, female,
nonwhite, married, south, northcen, west)
library(corrplot)
cor1 <- cor(wage1a)
corrplot(cor1, method = "number", type ="lower")
Quais variáveis você colocaria no modelo?