A histograma oferece uma forma útil de visualizar a distribuição de valores num conjunto de dados.

O eixo x de um histograma apresenta compartimentos de valores de dados e o eixo y indica-nos quantas observações de um conjunto de dados se inserem em cada compartimento.

Uma vez que um histograma coloca as observações em compartimentos, não é possível calcular o desvio padrão exato do conjunto de dados representado pelo histograma, mas é possível estimar o desvio padrão.

O exemplo seguinte mostra como o fazer.

Relacionadas: Como estimar a média e a mediana de qualquer histograma

Como estimar o desvio padrão de um histograma

Para estimar o desvio padrão de um histograma, é necessário primeiro estimar a média.

Podemos utilizar a seguinte fórmula para estimar a média:

Média: Σm i n i / N

onde:

  • m i : O ponto médio da i-ésima posição
  • n i : A frequência da i-ésima posição
  • N: A dimensão total da amostra

Por exemplo, suponha que temos o seguinte histograma:

Eis como estimaríamos o valor médio deste histograma:

Estimamos que a média seja 22.89 .

Nota: O ponto médio para cada grupo pode ser encontrado tomando a média do valor inferior e superior do intervalo. Por exemplo, o ponto médio para o primeiro grupo é calculado como: (1+10) / 2 = 5,5.

Agora que temos uma estimativa para a média, podemos usar a seguinte fórmula para estimar o desvio padrão:

Desvio padrão: √ Σn i (m i -μ)2 / (N-1)

onde:

  • n i : A frequência da i-ésima posição
  • m i : O ponto médio da i-ésima posição
  • μ : A média
  • N: A dimensão total da amostra

Eis como aplicaríamos esta fórmula ao nosso conjunto de dados:

Estimamos que o desvio padrão do conjunto de dados é 9.6377 .

Embora não seja garantido que este valor corresponda ao desvio padrão exato do conjunto de dados (uma vez que não conhecemos os valores dos dados em bruto do conjunto de dados), representa a nossa melhor estimativa do desvio padrão.