O teste t para duas amostras é utilizado para testar se as médias de duas populações são iguais ou não.

Este tutorial explica como efetuar um teste t de duas amostras em Python.

Exemplo: Teste t de duas amostras em Python

Os investigadores querem saber se duas espécies diferentes de plantas têm ou não a mesma altura média. Para o testar, recolhem uma amostra aleatória simples de 20 plantas de cada espécie.

Utilize os passos seguintes para efetuar um teste t de duas amostras para determinar se as duas espécies de plantas têm a mesma altura.

Passo 1: Criar os dados.

Primeiro, vamos criar duas matrizes para guardar as medidas de cada grupo de 20 plantas:

 import numpy as np group1 = np.array([14, 15, 15, 16, 13, 8, 14, 17, 16, 14, 19, 20, 21, 15, 15, 16, 16, 13, 14, 12]) group2 = np.array([15, 17, 14, 17, 14, 8, 12, 19, 19, 14, 17, 22, 24, 16, 13, 16, 13, 18, 15, 13]) 

Passo 2: Efetuar um teste t para duas amostras.

Em seguida, utilizaremos a função ttest_ind() da biblioteca scipy.stats para efetuar um teste t de duas amostras, que utiliza a seguinte sintaxe:

ttest_ind(a, b, equal_var=True)

onde:

  • a: um conjunto de observações de amostra para o grupo 1
  • b: um conjunto de observações de amostra para o grupo 2
  • igual_var: se for Verdadeiro, efectua um teste t de 2 amostras independentes padrão que assume variâncias populacionais iguais. se for Falso, efectua o teste t de Welch, que não assume variâncias populacionais iguais. esta opção é Verdadeira por predefinição.

Antes de efectuarmos o teste, temos de decidir se assumimos que as duas populações têm variâncias iguais ou não. Como regra geral, podemos assumir que as populações têm variâncias iguais se o rácio entre a variância da amostra maior e a variância da amostra menor for inferior a 4:1.

 #encontrar a variância para cada grupo print(np.var(grupo1), np.var(grupo2)) 7.73 12.26 

O rácio entre a variância da amostra maior e a variância da amostra menor é 12,26 / 7,73 = 1.586 Isto significa que podemos assumir que as variâncias populacionais são iguais.

Assim, podemos efetuar o teste t para duas amostras com variâncias iguais:

 import scipy.stats as stats #realizar dois testes t de amostras com variâncias iguais stats.ttest_ind(a=grupo1, b=grupo2, equal_var=True) (statistic=-0.6337, pvalue=0.53005) 

A estatística do teste t é -0.6337 e o valor p bilateral correspondente é 0.53005 .

Etapa 3: Interpretar os resultados.

As duas hipóteses para este teste t específico de duas amostras são as seguintes

H 0 : µ 1 = µ 2 (as duas médias populacionais são iguais)

H A : µ 1 ≠µ 2 (as duas médias populacionais são não igual)

Porque o valor p do nosso teste (0.53005) é superior a alfa = 0,05, não rejeitamos a hipótese nula do teste. Não temos provas suficientes para afirmar que a altura média das plantas entre as duas populações é diferente.