A gráfico de resíduos vs. alavancagem é um tipo de gráfico de diagnóstico que nos permite identificar observações influentes num modelo de regressão.
Eis como este tipo de gráfico aparece na linguagem de programação estatística R:
Cada observação do conjunto de dados é mostrada como um único ponto no gráfico. O eixo x mostra a alavancagem de cada ponto e o eixo y mostra o resíduo padronizado de cada ponto.
Alavancagem refere-se à medida em que os coeficientes do modelo de regressão se alterariam se uma determinada observação fosse retirada do conjunto de dados.
As observações com um elevado grau de endividamento têm uma forte influência nos coeficientes do modelo de regressão. Se eliminarmos estas observações, os coeficientes do modelo alterar-se-iam significativamente.
Resíduos normalizados referem-se à diferença padronizada entre um valor previsto para uma observação e o valor real da observação.
Vale a pena notar que uma observação pode ter um valor absoluto elevado para um resíduo padronizado, mas ter um valor baixo para a alavancagem.
Como interpretar um gráfico de resíduos vs. alavancagem
Se algum ponto neste gráfico estiver fora da distância de Cook (as linhas tracejadas vermelhas), então é considerado uma observação influente.
Vamos referir-nos ao gráfico de resíduos vs. alavancagem de há pouco:
No exemplo acima, podemos ver que a observação n.º 10 está mais próxima do limite da distância de Cook, mas não fica fora da linha tracejada. Isto significa que não existem pontos de influência no nosso modelo de regressão.
No entanto, suponhamos que tínhamos o seguinte gráfico de resíduos vs. alavancagem:
Podemos ver que a observação n.º 1, no canto superior direito, fica fora das linhas tracejadas vermelhas, o que indica que é um ponto influente .
Isto significa que, se removêssemos esta observação do nosso conjunto de dados e ajustássemos novamente o modelo de regressão, os coeficientes do modelo sofreriam alterações significativas.
Como lidar com observações influentes
Se criar um gráfico de resíduos vs. alavancagem para um modelo e descobrir que uma ou mais observações são identificadas como influentes, há algumas coisas que pode fazer:
1) Verificar se a observação não é um erro.
Antes de tomar qualquer medida, deve primeiro verificar se a(s) observação(ões) influente(s) não resulta(m) de um erro de introdução de dados ou de qualquer outra ocorrência estranha.
2. tentar ajustar outro modelo de regressão.
As observações influentes podem indicar que o modelo que especificou não se ajusta bem aos dados. Neste caso, pode tentar um modelo de regressão polinomial ou um modelo não linear.
3) Retirar as observações influentes.
Por último, pode decidir simplesmente remover as observações influentes se o modelo que especificou parece ajustar-se bem aos dados, exceto no que diz respeito a uma ou duas observações influentes.