Correlações

O que é uma correlação?

idade <- c(21, 46, 55, 35, 28)
renda <- c(1850, 2500, 2560, 2230, 1800)
data <- data.frame(idade, renda)
plot(data, pch = 16)

cor.plot(data) #função criada para o exemplo. Não é um comando base do R.

A correlação é positiva porque quase todos os pontos estão nos quadrantes azuis.

Função quadrática

t <- c(-30:30)
x <- -t^2
data2 <- data.frame(t, x)
plot(data2, pch = 16)

Qual será a correlação no gráfico acima?

cor.plot(data2)

Pontos nos quadrantes positivos são equivalentes aos nos negativos.

Correlação, portanto, mede a depedendência linear entre as variáveis.

Fonte do exemplo

Correlação e regressão linear

library(wooldridge)
data("wage1") # ?wage1 para ver o conjunto de variáveis
library(tidyverse)
wage1a <- wage1 %>% select (wage, educ, exper, expersq, female, 
                           nonwhite, married, south, northcen, west)
library(corrplot)
cor1 <- cor(wage1a)
corrplot(cor1, method = "number", type ="lower")

Quais variáveis você colocaria no modelo?

Como funciona uma regressão linear?

Next