Muitas vezes, em estatística, estamos interessados em medir parâmetros populacionais - números que descrevem alguma caraterística de toda uma população.
Por exemplo, podemos estar interessados em medir a altura média dos homens num determinado país.
Uma vez que é demasiado dispendioso e demorado recolher dados sobre a altura de todos os homens do país, em vez disso, recolheríamos dados sobre uma amostra aleatória simples de homens. Utilizaríamos então a altura média dos homens desta amostra para estimar a altura média de todos os homens do país.
Infelizmente, não é garantido que a altura média dos homens na amostra corresponda exatamente à altura média dos homens em toda a população. Por exemplo, pode acontecer que escolhamos uma amostra cheia de homens mais baixos ou talvez uma amostra cheia de homens mais altos.
Para captar a nossa incerteza em torno da nossa estimativa da verdadeira média populacional, podemos criar um intervalo de confiança.
Intervalo de confiança: Um intervalo de valores que é suscetível de conter um parâmetro populacional com um determinado nível de confiança.
Um intervalo de confiança é calculado utilizando a seguinte fórmula geral:
Intervalo de confiança = (estimativa pontual) +/- (valor crítico)*(erro padrão)
Por exemplo, a fórmula para calcular um intervalo de confiança para uma média populacional é a seguinte
Intervalo de confiança = x +/- z*(s/√ n )
onde:
- x : média da amostra
- z: o valor crítico z
- s: desvio padrão da amostra
- n: dimensão da amostra
O valor crítico z que será utilizado na fórmula depende do nível de confiança que escolher.
Nível de confiança: A percentagem de todas as amostras possíveis que se espera que incluam o verdadeiro parâmetro da população.
As escolhas mais comuns para os níveis de confiança incluem 90%, 95% e 99%.
A tabela seguinte mostra o valor crítico z que corresponde a estas escolhas populares de nível de confiança:
Nível de confiança | valor crítico z |
---|---|
0.90 | 1.645 |
0.95 | 1.96 |
0.99 | 2.58 |
Por exemplo, suponhamos que medimos as alturas de 25 homens e encontramos o seguinte:
- Tamanho da amostra n = 25
- Altura média da amostra x = 70 polegadas
- Desvio-padrão da amostra s = 1,2 polegadas
Eis como calcular um intervalo de confiança para a verdadeira altura média da população utilizando um Nível de confiança de 90% :
Intervalo de confiança de 90%: 70 +/- 1,645*(1,2/√25) = [69.6052, 70.3948]
Isto significa que se utilizássemos o mesmo método de amostragem para selecionar amostras diferentes e calculássemos um intervalo de confiança para cada amostra, esperaríamos que a verdadeira altura média da população se situasse dentro do intervalo em 90% das vezes.
Agora suponhamos que, em vez disso, calculamos um intervalo de confiança utilizando um Nível de confiança de 95%:
Intervalo de confiança de 95%: 70 +/- 1,96*(1,2/√25) = [69.5296, 70.4704]
Repare que este intervalo de confiança é mais largo do que o anterior, porque quanto maior for o nível de confiança, maior será o intervalo de confiança.
Quanto maior for o nível de confiança, maior será o intervalo de confiança.
Isto deve fazer sentido intuitivamente: um nível de confiança mais alargado tem uma maior probabilidade de conter um parâmetro populacional verdadeiro.
Resumo
Em resumo:
A intervalo de confiança é um intervalo de valores que é provável que contenha um parâmetro populacional com um determinado nível de confiança. Utiliza a seguinte fórmula básica:
Intervalo de confiança = (estimativa pontual) +/- (valor crítico)*(erro padrão)
O nível de confiança Quanto maior for o nível de confiança, maior será o valor crítico e, consequentemente, maior será o intervalo de confiança.