Sempre que efetuar uma regressão linear no R, o resultado do seu modelo de regressão será apresentado no seguinte formato:
Coeficientes: Estimativa Erro Std. Valor t Pr(>
O Pr(> A coluna representa o valor p associado ao valor na coluna valor t coluna.
Se o valor p for inferior a um determinado nível de significância (por exemplo, α = 0,05), diz-se que a variável de previsão tem uma relação estatisticamente significativa com a variável de resposta no modelo.
O exemplo a seguir mostra como interpretar valores no campo Pr(>
Exemplo: Como interpretar Pr(>
Suponha que gostaríamos de ajustar um modelo de regressão linear múltipla usando variáveis preditoras x1 e x2 e uma única variável de resposta y .
O código seguinte mostra como criar um quadro de dados e ajustar um modelo de regressão aos dados:
#criar quadro de dados df <- data. frame (x1=c(1, 3, 3, 4, 4, 5, 6, 6), x2=c(7, 7, 5, 6, 5, 4, 5, 6), y=c(8, 8, 9, 9, 13, 14, 17, 14)) #ajustar modelo de regressão linear múltipla modeloliberdade R-quadrado múltiplo: 0,7876, R-quadrado ajustado: 0,7026 F-estatística: 9,268 em 2 e 5 DF, p-valor: 0,0208
Eis como interpretar os valores na tabela Pr(>
- O valor p para a variável preditora x1 é .0325 Uma vez que este valor é inferior a 0,05, tem uma relação estatisticamente significativa com a variável de resposta no modelo.
- O valor p para a variável preditora x2 é .3732 Uma vez que este valor não é inferior a 0,05, não tem uma relação estatisticamente significativa com a variável de resposta no modelo.
Os códigos de significância sob a tabela de coeficientes dizem-nos que um único asterisco (*) junto ao valor p de .0325 significa que o valor p é estatisticamente significativo a α = .05.
Como é que Pr(>
Eis como o valor de Pr(>
Passo 1: Calcular o valor t
Em primeiro lugar, calculamos o valor t utilizando a seguinte fórmula:
- valor t = Estimativa / Erro Std.
Por exemplo, eis como calcular o valor t para a variável preditora x1:
#calcular o valor t 1,4758 / .5029 2,934579
Passo 2: Calcular o valor p
De seguida, calculamos o valor p. Este valor representa a probabilidade de o valor absoluto da distribuição t ser superior a 2,935.
Podemos utilizar a seguinte fórmula em R para calcular este valor:
- valor de p = 2 * pt(abs(valor t), df residual, lower.tail = FALSE)
Por exemplo, eis como calcular o valor p para um valor t de 2,935 com 5 graus de liberdade residuais:
#calcular o valor p 2 * pt( abs (2.935), 5, lower. tail = FALSE ) 0.0324441
Repare que este valor de p corresponde ao valor de p no resultado da regressão acima.
Nota: O valor dos graus de liberdade residuais pode ser encontrado perto da parte inferior do resultado da regressão. No nosso exemplo, foi de 5:
Erro padrão residual: 1,867 em 5 graus de liberdade