A gráfico de caixa é um tipo de gráfico que apresenta o resumo de cinco números de um conjunto de dados, que inclui:

  • O valor mínimo
  • O primeiro quartil (o percentil 25)
  • O valor mediano
  • O terceiro quartil (o percentil 75)
  • O valor máximo

Utilizamos o seguinte processo para desenhar um gráfico de caixa:

  • Desenhe uma caixa desde o primeiro quartil (Q1) até ao terceiro quartil (Q3)
  • Em seguida, desenhe uma linha dentro da caixa na mediana
  • Em seguida, desenhe "bigodes" a partir dos quartis para os valores mínimo e máximo

Podemos determinar se uma distribuição é ou não enviesada com base na localização do valor mediano no gráfico de caixa.

Quando a mediana está mais próxima da parte inferior da caixa e o whisker é mais curto na extremidade inferior da caixa, a distribuição é enviesada para a direita (ou enviesada "positivamente").

Quando a mediana está mais próxima do topo da caixa e o whisker é mais curto na extremidade superior da caixa, a distribuição é enviesada para a esquerda (ou enviesada "negativamente").

Quando a mediana se encontra no meio da caixa e os bigodes são aproximadamente iguais em cada lado, a distribuição é simétrica (ou "sem" enviesamento).

Os exemplos seguintes ilustram como utilizar gráficos de caixa para determinar se uma distribuição é enviesada para a direita, enviesada para a esquerda ou não tem enviesamento.

Exemplo 1: Distribuição enviesada à direita

A distribuição dos rendimentos anuais dos agregados familiares nos Estados Unidos é enviesada para a direita. A maioria dos agregados familiares ganha entre $40k e $80k por ano, mas existe uma longa cauda direita na distribuição que representa os agregados familiares que ganham muito mais.

Se criássemos um gráfico de caixa para visualizar a distribuição dos rendimentos dos agregados familiares, este teria o seguinte aspeto:

Repare que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do primeiro quartil do que do terceiro quartil, o que significa que a distribuição é assimétrica à direita.

Exemplo 2: Distribuição enviesada à esquerda

A distribuição da idade de morte na maioria das populações é enviesada para a esquerda: a maioria das pessoas vive até aos 70 e 80 anos, sendo cada vez menos as que vivem menos do que esta idade.

Se criássemos um gráfico de caixa para visualizar a distribuição da idade dos óbitos, este teria o seguinte aspeto:

Repare que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do terceiro quartil do que do primeiro quartil, o que significa que a distribuição é assimétrica à esquerda.

Exemplo 3: Distribuição simétrica

A distribuição da altura dos homens é aproximadamente simétrica e não tem enviesamento. Por exemplo, a altura média de um homem nos Estados Unidos é de cerca de 69,1 polegadas. A distribuição das alturas é aproximadamente simétrica, sendo algumas mais baixas e outras mais altas.

Se criássemos um gráfico de caixa para visualizar a distribuição da altura dos homens nos Estados Unidos, teria o seguinte aspeto:

Repare que a linha vertical no interior da caixa que representa a mediana está igualmente próxima do primeiro quartil e do terceiro quartil, o que significa que a distribuição é simétrica e não tem assimetria.