Em estatística, o termo variação refere-se ao grau de dispersão dos valores num determinado conjunto de dados.
Uma pergunta comum que os alunos têm frequentemente sobre a variância é:
A variância pode ser negativa?
A resposta: Não, a variância não pode ser negativa. O valor mais baixo que pode assumir é zero.
Para saber porque é que isto acontece, temos de compreender como é que a variância é efetivamente calculada.
Como calcular o desvio
A fórmula para encontrar a variância de uma amostra (denotada como s2 ) é:
s2 = Σ (x i - x )2 / (n-1)
onde:
- x A média da amostra
- x i : A i-ésima observação na amostra
- N A dimensão da amostra
- Σ Símbolo grego que significa "soma".
Por exemplo, suponhamos que temos o seguinte conjunto de dados com 10 valores:
Podemos utilizar os seguintes passos para calcular a variância desta amostra:
Passo 1: Encontrar a média
A média é simplesmente a média, o que resulta em 14.7 .
Passo 2: Encontrar os desvios quadrados
Em seguida, podemos calcular o desvio quadrático de cada valor individual em relação à média.
Por exemplo, o primeiro desvio ao quadrado é calculado como (6-14,7)2 = 75,69.
Passo 3: Encontrar a soma dos desvios quadrados
De seguida, podemos obter a soma de todos os desvios ao quadrado:
Passo 4: Calcular a variância da amostra
Por fim, podemos calcular a variância da amostra como a soma dos desvios ao quadrado dividida por (n-1):
s2 = 330.1 / (10-1) = 330.1 / 9 = 36.678
A variância da amostra é de 36.678 .
Um exemplo de variância zero
A única forma de um conjunto de dados poder ter uma variância de zero é se todos os valores do conjunto de dados são iguais .
Por exemplo, o seguinte conjunto de dados tem uma variância amostral de zero:
A média do conjunto de dados é 15 e nenhum dos valores individuais se desvia da média. Assim, a soma dos desvios ao quadrado será zero e a variância da amostra será simplesmente zero.
O desvio padrão pode ser negativo?
Uma forma mais comum de medir a dispersão dos valores num conjunto de dados é utilizar o desvio padrão, que é simplesmente a raiz quadrada da variância.
Por exemplo, se a variância de uma determinada amostra for s2 = 36.678 o desvio padrão (escrito como s ) é calculado como:
s = √ s2 = √ 36,678 = 6.056
Como já sabemos que a variância é sempre zero ou um número positivo, isto significa que o desvio-padrão nunca pode ser negativo, uma vez que a raiz quadrada de zero ou de um número positivo não pode ser negativa.