Gráficos residuais são frequentemente utilizados para avaliar se os resíduos de uma análise de regressão são ou não normalmente distribuídos e se apresentam ou não heterocedasticidade.
Este tutorial explica como criar gráficos residuais para um modelo de regressão em R.
Exemplo: Gráficos residuais no R
Neste exemplo, vamos ajustar um modelo de regressão utilizando o conjunto de dados incorporado no R mtcars e, em seguida, produzir três gráficos residuais diferentes para analisar os resíduos.
Passo 1: Ajustar o modelo de regressão.
Primeiro, vamos ajustar um modelo de regressão utilizando mpg como variável de resposta e disp e hp como variáveis explicativas:
#carregar o conjunto de dados data(mtcars) #ajustar um modelo de regressão model <- lm(mpg~disp+hp, data=mtcars) #obter lista de resíduos res <- resid(model)
Passo 2: Produzir um gráfico residual vs. ajustado.
Em seguida, produziremos um gráfico de resíduos vs. ajustado, que é útil para detetar visualmente a heterocedasticidade - por exemplo, uma alteração sistemática na dispersão dos resíduos ao longo de um intervalo de valores.
#produzir gráfico residual vs. ajustado plot(fitted(model), res) #adicionar uma linha horizontal em 0 abline(0,0)
O eixo x apresenta os valores ajustados e o eixo y apresenta os resíduos. A partir do gráfico, podemos ver que a dispersão dos resíduos tende a ser maior para valores ajustados mais elevados, mas não parece suficientemente grave para que seja necessário efetuar quaisquer alterações ao modelo.
Passo 3: Produzir um gráfico Q-Q.
Também podemos produzir um gráfico Q-Q, que é útil para determinar se os resíduos seguem uma distribuição normal. Se os valores dos dados no gráfico caírem ao longo de uma linha aproximadamente reta num ângulo de 45 graus, então os dados são normalmente distribuídos.
#criar gráfico Q-Q para os resíduos qqnorm(res) #adicionar uma linha reta diagonal ao gráfico qqline(res)
Podemos ver que os resíduos tendem a afastar-se um pouco da linha perto das caudas, o que pode indicar que não são normalmente distribuídos.
Passo 4: Produzir um gráfico de densidade.
Também podemos produzir um gráfico de densidade, que também é útil para verificar visualmente se os resíduos têm ou não uma distribuição normal. Se o gráfico tiver uma forma aproximada de sino, então os resíduos seguem provavelmente uma distribuição normal.
#Criar um gráfico de densidade dos resíduos plot(density(res))
Dependendo do tipo de estudo, um investigador pode ou não decidir efetuar uma transformação dos dados para assegurar que os resíduos têm uma distribuição mais normal.