Muitas vezes, em estatística, estamos interessados em medir parâmetros populacionais - números que descrevem alguma caraterística de toda uma população.

Por exemplo, podemos estar interessados em medir a altura média dos homens num determinado país.

Uma vez que é demasiado dispendioso e demorado recolher dados sobre a altura de todos os homens do país, em vez disso, recolheríamos dados sobre uma amostra aleatória simples de homens. Utilizaríamos então a altura média dos homens desta amostra para estimar a altura média de todos os homens do país.

Infelizmente, não é garantido que a altura média dos homens na amostra corresponda exatamente à altura média dos homens em toda a população. Por exemplo, pode acontecer que escolhamos uma amostra cheia de homens mais baixos ou talvez uma amostra cheia de homens mais altos.

Para captar a nossa incerteza em torno da nossa estimativa da verdadeira média populacional, podemos criar um intervalo de confiança.

Intervalo de confiança: Um intervalo de valores que é suscetível de conter um parâmetro populacional com um determinado nível de confiança.

Um intervalo de confiança é calculado utilizando a seguinte fórmula geral:

Intervalo de confiança = (estimativa pontual) +/- (valor crítico)*(erro padrão)

Por exemplo, a fórmula para calcular um intervalo de confiança para uma média populacional é a seguinte

Intervalo de confiança = x +/- z*(s/√ n )

onde:

  • x : média da amostra
  • z: o valor crítico z
  • s: desvio padrão da amostra
  • n: dimensão da amostra

O valor crítico z que será utilizado na fórmula depende do nível de confiança que escolher.

Nível de confiança: A percentagem de todas as amostras possíveis que se espera que incluam o verdadeiro parâmetro da população.

As escolhas mais comuns para os níveis de confiança incluem 90%, 95% e 99%.

A tabela seguinte mostra o valor crítico z que corresponde a estas escolhas populares de nível de confiança:

Nível de confiança valor crítico z
0.90 1.645
0.95 1.96
0.99 2.58

Por exemplo, suponhamos que medimos as alturas de 25 homens e encontramos o seguinte:

  • Tamanho da amostra n = 25
  • Altura média da amostra x = 70 polegadas
  • Desvio-padrão da amostra s = 1,2 polegadas

Eis como calcular um intervalo de confiança para a verdadeira altura média da população utilizando um Nível de confiança de 90% :

Intervalo de confiança de 90%: 70 +/- 1,645*(1,2/√25) = [69.6052, 70.3948]

Isto significa que se utilizássemos o mesmo método de amostragem para selecionar amostras diferentes e calculássemos um intervalo de confiança para cada amostra, esperaríamos que a verdadeira altura média da população se situasse dentro do intervalo em 90% das vezes.

Agora suponhamos que, em vez disso, calculamos um intervalo de confiança utilizando um Nível de confiança de 95%:

Intervalo de confiança de 95%: 70 +/- 1,96*(1,2/√25) = [69.5296, 70.4704]

Repare que este intervalo de confiança é mais largo do que o anterior, porque quanto maior for o nível de confiança, maior será o intervalo de confiança.

Quanto maior for o nível de confiança, maior será o intervalo de confiança.

Isto deve fazer sentido intuitivamente: um nível de confiança mais alargado tem uma maior probabilidade de conter um parâmetro populacional verdadeiro.

Resumo

Em resumo:

A intervalo de confiança é um intervalo de valores que é provável que contenha um parâmetro populacional com um determinado nível de confiança. Utiliza a seguinte fórmula básica:

Intervalo de confiança = (estimativa pontual) +/- (valor crítico)*(erro padrão)

O nível de confiança Quanto maior for o nível de confiança, maior será o valor crítico e, consequentemente, maior será o intervalo de confiança.