Em estatística, o termo variação refere-se ao grau de dispersão dos valores num determinado conjunto de dados.

Uma pergunta comum que os alunos têm frequentemente sobre a variância é:

A variância pode ser negativa?

A resposta: Não, a variância não pode ser negativa. O valor mais baixo que pode assumir é zero.

Para saber porque é que isto acontece, temos de compreender como é que a variância é efetivamente calculada.

Como calcular o desvio

A fórmula para encontrar a variância de uma amostra (denotada como s2 ) é:

s2 = Σ (x i - x )2 / (n-1)

onde:

  • x A média da amostra
  • x i : A i-ésima observação na amostra
  • N A dimensão da amostra
  • Σ Símbolo grego que significa "soma".

Por exemplo, suponhamos que temos o seguinte conjunto de dados com 10 valores:

Podemos utilizar os seguintes passos para calcular a variância desta amostra:

Passo 1: Encontrar a média

A média é simplesmente a média, o que resulta em 14.7 .

Passo 2: Encontrar os desvios quadrados

Em seguida, podemos calcular o desvio quadrático de cada valor individual em relação à média.

Por exemplo, o primeiro desvio ao quadrado é calculado como (6-14,7)2 = 75,69.

Passo 3: Encontrar a soma dos desvios quadrados

De seguida, podemos obter a soma de todos os desvios ao quadrado:

Passo 4: Calcular a variância da amostra

Por fim, podemos calcular a variância da amostra como a soma dos desvios ao quadrado dividida por (n-1):

s2 = 330.1 / (10-1) = 330.1 / 9 = 36.678

A variância da amostra é de 36.678 .

Um exemplo de variância zero

A única forma de um conjunto de dados poder ter uma variância de zero é se todos os valores do conjunto de dados são iguais .

Por exemplo, o seguinte conjunto de dados tem uma variância amostral de zero:

A média do conjunto de dados é 15 e nenhum dos valores individuais se desvia da média. Assim, a soma dos desvios ao quadrado será zero e a variância da amostra será simplesmente zero.

O desvio padrão pode ser negativo?

Uma forma mais comum de medir a dispersão dos valores num conjunto de dados é utilizar o desvio padrão, que é simplesmente a raiz quadrada da variância.

Por exemplo, se a variância de uma determinada amostra for s2 = 36.678 o desvio padrão (escrito como s ) é calculado como:

s = √ s2 = √ 36,678 = 6.056

Como já sabemos que a variância é sempre zero ou um número positivo, isto significa que o desvio-padrão nunca pode ser negativo, uma vez que a raiz quadrada de zero ou de um número positivo não pode ser negativa.