Uma ANOVA unidirecional é utilizada para determinar se existe ou não uma diferença estatisticamente significativa entre as médias de três ou mais grupos independentes.
O exemplo seguinte mostra como interpretar os resultados de uma ANOVA unidirecional no SAS.
Exemplo: Interpretar resultados da ANOVA no SAS
Suponha que um investigador recruta 30 estudantes para participarem num estudo e que lhes é atribuído aleatoriamente um de três métodos de estudo para se prepararem para um exame.
Os resultados dos exames de cada aluno são apresentados a seguir:
Podemos utilizar o seguinte código para criar este conjunto de dados no SAS:
/*create dataset*/ data my_data; input Method $ Score; datalines ; A 78 A 81 A 82 A 82 A 82 A 85 A 88 A 88 A 90 B 81 B 83 B 83 B 85 B 86 B 88 B 90 B 91 C 84 C 88 C 88 C 89 C 90 C 93 C 95 C 98 ; run ;
A seguir, utilizaremos proc ANOVA para efetuar a ANOVA unidirecional:
/*executar ANOVA unidirecional*/ proc ANOVA data =my_data; class Method; model Score = Method; means Method / tukey cldiff ; run ;
Nota : Utilizámos o meios juntamente com a declaração tukey e cldiff opções para especificar que deve ser efectuado um teste post-hoc de Tukey (com intervalos de confiança) se o valor p global da ANOVA unidirecional for estatisticamente significativo.
Primeiro, veremos a tabela ANOVA na saída:
Eis como interpretar cada valor na saída:
Modelo DF: Os graus de liberdade da variável método Este valor é calculado como #grupos -1. Neste caso, havia 3 métodos de estudo diferentes, pelo que este valor é: 3-1 = 2 .
Erro DF: Os graus de liberdade para os resíduos, calculados como #total de observações - # grupos. Neste caso, havia 24 observações e 3 grupos, pelo que este valor é: 24-3 = 21 .
Total corrigido Soma do Modelo DF e do Erro DF: Este valor é 2 + 21 = 23 .
Modelo de Soma de Quadrados: A soma dos quadrados associada à variável método Este valor é 175.583 .
Soma dos erros quadrados: A soma dos quadrados associada aos resíduos ou "erros". Este valor é 350.25 .
Soma de quadrados corrigida Total Soma do modelo SS e do erro SS. Este valor é 525.833 .
Modelo de Quadrado Médio: A soma média dos quadrados associada a método Este valor é calculado como Modelo SS / Modelo DF, que é175,583 / 2 = 87.79 .
Erro quadrático médio: A soma média dos quadrados associada aos resíduos, calculada como Erro SS / Erro DF, que é 350,25 / 21 = 16.68 .
Valor F: A estatística F global do modelo ANOVA, que é calculada como o quadrado médio do modelo / erro quadrático médio, que é 87,79 / 16,68 = 5.26 .
Pr>F: O valor de p associado à estatística F com numerador df = 2 e denominador df = 21. Neste caso, o valor de p é 0.0140 .
O valor mais importante em todo o resultado é o valor p, porque nos diz se existe uma diferença significativa nos valores médios entre os três grupos.
Recorde-se que uma ANOVA unidirecional utiliza as seguintes hipóteses nula e alternativa:
- H 0 (hipótese nula): Todas as médias dos grupos são iguais.
- H A (hipótese alternativa): Pelo menos uma média de grupo é diferente das restantes.
Uma vez que o valor de p na nossa tabela ANOVA (0,0140) é inferior a 0,05, rejeitamos a hipótese nula.
Isto significa que temos provas suficientes para afirmar que a nota média do exame não é igual entre os três métodos de estudo.
Para determinar exatamente que médias de grupo são diferentes, temos de consultar a tabela final no output que mostra os resultados dos testes post-hoc de Tukey:
Para saber quais as médias dos grupos que são diferentes, temos de ver quais as comparações entre pares que têm estrelas ( *** ) ao seu lado.
A partir da tabela, podemos ver que existe uma diferença estatisticamente significativa nas classificações médias dos exames entre o grupo A e o grupo C.
Especificamente, a diferença média nas classificações dos exames entre o grupo C e o grupo A é 6.375 .
O intervalo de confiança de 95% para a diferença média é [1.228, 11.522] .
Não existem diferenças estatisticamente significativas entre as médias dos outros grupos.