O desvio padrão de um conjunto de dados é uma forma de medir a distância entre o valor médio e a média.

Para encontrar o desvio padrão de uma determinada amostra, podemos utilizar a seguinte fórmula:

s = √(Σ(x i - x )2 / (n-1))

onde:

  • Σ: Um símbolo que significa "soma"
  • x i : O valor da i-ésima observação na amostra
  • x : A média da amostra
  • n: A dimensão da amostra

Quanto maior for o valor do desvio padrão, mais dispersos estão os valores numa amostra. No entanto, é difícil dizer se um determinado valor para um desvio padrão é "alto" ou "baixo" porque depende do tipo de dados com que estamos a trabalhar.

Por exemplo, um desvio padrão de 500 pode ser considerado baixo se estivermos a falar do rendimento anual dos residentes de uma determinada cidade. Por outro lado, um desvio padrão de 50 pode ser considerado elevado se estivermos a falar das notas dos alunos num determinado teste.

Uma forma de perceber se um determinado valor do desvio-padrão é alto ou baixo é encontrar o coeficiente de variação que é calculado como:

CV = s / x

onde:

  • s: O desvio padrão da amostra
  • x : A média da amostra

Em termos simples, o coeficiente de variação é o rácio entre o desvio padrão e a média.

Quanto maior for o coeficiente de variação, maior será o desvio padrão de uma amostra relativo para a média.

Exemplo: Cálculo do desvio padrão & Coeficiente de variação

Suponhamos que temos o seguinte conjunto de dados:

Conjunto de dados: 1, 4, 8, 11, 13, 17, 19, 19, 20, 23, 24, 24, 25, 28, 29, 31, 32

Utilizando uma calculadora, podemos encontrar as seguintes métricas para este conjunto de dados:

  • Média da amostra ( x ): 19,29
  • Desvio-padrão da amostra (s): 9,25

Podemos então utilizar estes valores para calcular o coeficiente de variação:

  • CV = s / x
  • CV = 9,25 / 19,29
  • CV = 0,48

É útil conhecer tanto o desvio-padrão como o coeficiente de variação para este conjunto de dados.

O desvio padrão indica-nos que o valor típico deste conjunto de dados se encontra a 9,25 unidades de distância da média. O coeficiente de variação indica-nos que o desvio padrão é cerca de metade do tamanho da média da amostra.

Desvio padrão vs. coeficiente de variação: quando usar cada um

O desvio padrão é utilizado mais frequentemente quando se pretende conhecer a dispersão dos valores num único conjunto de dados.

No entanto, o coeficiente de variação é mais frequentemente utilizado quando se pretende comparar a variação entre dois conjuntos de dados.

Por exemplo, em finanças, o coeficiente de variação é utilizado para comparar o rendimento médio esperado de um investimento relativamente ao desvio padrão esperado do investimento.

Por exemplo, suponhamos que um investidor está a considerar investir nos dois fundos de investimento seguintes:

Fundo Mútuo A: média = 9%, desvio padrão = 12,4%

Fundo Mútuo B: média = 5%, desvio padrão = 8,2%

O investidor pode calcular o coeficiente de variação para cada fundo:

  • CV do Fundo de Investimento A = 12,4% / 9% = 1.38
  • CV do Fundo de Investimento B = 8,2% / 5% = 1.64

Uma vez que o Fundo Mútuo A tem um coeficiente de variação mais baixo, oferece uma melhor rendibilidade média em relação ao desvio padrão.

Resumo

Segue-se um breve resumo dos principais pontos deste artigo:

  • Tanto o desvio padrão como o coeficiente de variação medem a dispersão dos valores num conjunto de dados.
  • O desvio padrão mede a distância entre o valor médio e a média.
  • O coeficiente de variação mede o rácio entre o desvio padrão e a média.
  • O desvio padrão é utilizado mais frequentemente quando se pretende medir a dispersão dos valores num único conjunto de dados.
  • O coeficiente de variação é utilizado com mais frequência quando se pretende comparar a variação entre dois conjuntos de dados diferentes.