O teste t para duas amostras é utilizado para testar se as médias de duas populações são iguais ou não.
Este tutorial explica como efetuar um teste t de duas amostras em Python.
Exemplo: Teste t de duas amostras em Python
Os investigadores querem saber se duas espécies diferentes de plantas têm ou não a mesma altura média. Para o testar, recolhem uma amostra aleatória simples de 20 plantas de cada espécie.
Utilize os passos seguintes para efetuar um teste t de duas amostras para determinar se as duas espécies de plantas têm a mesma altura.
Passo 1: Criar os dados.
Primeiro, vamos criar duas matrizes para guardar as medidas de cada grupo de 20 plantas:
import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13])
Passo 2: Efetuar um teste t para duas amostras.
Em seguida, utilizaremos a função ttest_ind() da biblioteca scipy.stats para efetuar um teste t de duas amostras, que utiliza a seguinte sintaxe:
ttest_ind(a, b, equal_var=True)
onde:
- a: um conjunto de observações de amostra para o grupo 1
- b: um conjunto de observações de amostra para o grupo 2
- igual_var: se for Verdadeiro, efectua um teste t de 2 amostras independentes padrão que assume variâncias populacionais iguais. se for Falso, efectua o teste t de Welch, que não assume variâncias populacionais iguais. esta opção é Verdadeira por predefinição.
Antes de efectuarmos o teste, temos de decidir se assumimos que as duas populações têm variâncias iguais ou não. Como regra geral, podemos assumir que as populações têm variâncias iguais se o rácio entre a variância da amostra maior e a variância da amostra menor for inferior a 4:1.
#encontrar a variância para cada grupo print(np.var(grupo1), np.var(grupo2)) 7.73 12.26
O rácio entre a variância da amostra maior e a variância da amostra menor é 12,26 / 7,73 = 1.586 Isto significa que podemos assumir que as variâncias populacionais são iguais.
Assim, podemos efetuar o teste t para duas amostras com variâncias iguais:
import scipy.stats as stats #realizar dois testes t de amostras com variâncias iguais stats.ttest_ind(a=grupo1, b=grupo2, equal_var=True) (statistic=-0.6337, pvalue=0.53005)
A estatística do teste t é -0.6337 e o valor p bilateral correspondente é 0.53005 .
Etapa 3: Interpretar os resultados.
As duas hipóteses para este teste t específico de duas amostras são as seguintes
H 0 : µ 1 = µ 2 (as duas médias populacionais são iguais)
H A : µ 1 ≠µ 2 (as duas médias populacionais são não igual)
Porque o valor p do nosso teste (0.53005) é superior a alfa = 0,05, não rejeitamos a hipótese nula do teste. Não temos provas suficientes para afirmar que a altura média das plantas entre as duas populações é diferente.