A regressão linear simples é um método que podemos utilizar para compreender a relação entre uma variável de previsão e uma variável de resposta.
Este tutorial explica como efetuar uma regressão linear simples no SPSS.
Exemplo: Regressão Linear Simples no SPSS
Suponhamos que temos o seguinte conjunto de dados que mostra o número de horas estudadas e a nota do exame recebida por 20 alunos:
Utilize os passos seguintes para efetuar uma regressão linear simples neste conjunto de dados para quantificar a relação entre as horas estudadas e a nota do exame:
Passo 1: Visualizar os dados.
Primeiro, vamos criar um gráfico de dispersão para visualizar a relação entre as horas e a pontuação, para nos certificarmos de que a relação entre as duas variáveis parece ser linear. Caso contrário, a regressão linear simples não será uma técnica adequada a utilizar.
Clique no botão Gráficos e, em seguida, clique em Criador de gráficos :
No Escolha entre menu, clicar e arrastar Dispersão/ponto para a janela principal de edição. De seguida, arraste a variável horas no eixo x e pontuação no eixo y.
Depois de clicar em OK , aparecerá o seguinte gráfico de dispersão:
A partir do gráfico, podemos ver que existe uma relação linear positiva entre as horas e a pontuação. Em geral, os alunos que estudam durante mais horas tendem a obter pontuações mais elevadas.
Uma vez que existe uma relação linear clara entre as duas variáveis, vamos proceder ao ajuste de um modelo de regressão linear simples ao conjunto de dados.
Passo 2: Ajustar um modelo de regressão linear simples.
Clique no botão Analisar separador e, em seguida Regressão , então Linear :
Na nova janela que aparece, arraste a variável pontuação na caixa intitulada Dependente e arraste horas na caixa Independente. Em seguida, clique em OK .
Etapa 3: Interpretar os resultados.
Depois de clicar em OK A primeira tabela que nos interessa é a que tem por título Resumo do modelo :
Eis como interpretar os números mais relevantes desta tabela:
- R Quadrado: Esta é a proporção da variância na variável de resposta que pode ser explicada pela variável explicativa. Neste exemplo, 50.6% da variação nas classificações dos exames pode ser explicada pelas horas de estudo.
- Erro Std. da Estimativa: O erro padrão é a distância média a que os valores observados se afastam da reta de regressão. Neste exemplo, os valores observados afastam-se em média de 5.861 unidades da linha de regressão.
A próxima tabela que nos interessa é intitulada Coeficientes :
Eis como interpretar os números mais relevantes desta tabela:
- Não padronizado B (Constante) Isto indica-nos o valor médio da variável de resposta quando a variável preditora é zero. Neste exemplo, a pontuação média do exame é 73.662 quando as horas estudadas são iguais a zero.
- B não padronizado (horas): Isto indica-nos a alteração média na variável de resposta associada a um aumento de uma unidade na variável preditora. Neste exemplo, cada hora adicional estudada está associada a um aumento de 3.342 na pontuação do exame, em média.
- Sig (horas): Este é o valor de p associado à estatística de teste para horas. Neste caso, como este valor é inferior a 0,05, podemos concluir que a variável preditora horas é estatisticamente significativo.
Por fim, podemos formar uma equação de regressão utilizando os valores de constante e horas Neste caso, a equação seria:
Nota estimada do exame = 73,662 + 3,342*(horas)
Podemos utilizar esta equação para encontrar a pontuação estimada do exame para um aluno, com base no número de horas que estudou.
Por exemplo, espera-se que um aluno que estuda durante 3 horas obtenha uma classificação de 83,688 no exame:
Nota estimada do exame = 73,662 + 3,342*(3) = 83,688
Passo 4: Comunicar os resultados.
Por último, queremos resumir os resultados da nossa regressão linear simples. Eis um exemplo de como o fazer:
Foi efectuada uma regressão linear simples para quantificar a relação entre as horas estudadas e a nota recebida no exame, tendo sido utilizada uma amostra de 20 alunos na análise.
Os resultados mostraram que existia uma relação estatisticamente significativa entre as horas estudadas e a nota do exame (t = 4,297, p <0,000) e que as horas estudadas eram responsáveis por 50,6% da variabilidade explicada na nota do exame.
A equação de regressão foi a seguinte:
Nota estimada do exame = 73,662 + 3,342*(horas)
Cada hora adicional estudada está associada a um aumento de 3.342 na pontuação do exame, em média.