- Exemplo 1: Distribuição enviesada à direita
- Exemplo 2: Distribuição enviesada à esquerda
- Exemplo 3: Distribuição simétrica
A gráfico de caixa é um tipo de gráfico que apresenta o resumo de cinco números de um conjunto de dados, que inclui:
- O valor mínimo
- O primeiro quartil (o percentil 25)
- O valor mediano
- O terceiro quartil (o percentil 75)
- O valor máximo
Utilizamos o seguinte processo para desenhar um gráfico de caixa:
- Desenhe uma caixa desde o primeiro quartil (Q1) até ao terceiro quartil (Q3)
- Em seguida, desenhe uma linha dentro da caixa na mediana
- Em seguida, desenhe "bigodes" a partir dos quartis para os valores mínimo e máximo
Podemos determinar se uma distribuição é ou não enviesada com base na localização do valor mediano no gráfico de caixa.
Quando a mediana está mais próxima da parte inferior da caixa e o whisker é mais curto na extremidade inferior da caixa, a distribuição é enviesada para a direita (ou enviesada "positivamente").
Quando a mediana está mais próxima do topo da caixa e o whisker é mais curto na extremidade superior da caixa, a distribuição é enviesada para a esquerda (ou enviesada "negativamente").
Quando a mediana se encontra no meio da caixa e os bigodes são aproximadamente iguais em cada lado, a distribuição é simétrica (ou "sem" enviesamento).
Os exemplos seguintes ilustram como utilizar gráficos de caixa para determinar se uma distribuição é enviesada para a direita, enviesada para a esquerda ou não tem enviesamento.
Exemplo 1: Distribuição enviesada à direita
A distribuição dos rendimentos anuais dos agregados familiares nos Estados Unidos é enviesada para a direita. A maioria dos agregados familiares ganha entre $40k e $80k por ano, mas existe uma longa cauda direita na distribuição que representa os agregados familiares que ganham muito mais.
Se criássemos um gráfico de caixa para visualizar a distribuição dos rendimentos dos agregados familiares, este teria o seguinte aspeto:
Repare que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do primeiro quartil do que do terceiro quartil, o que significa que a distribuição é assimétrica à direita.
Exemplo 2: Distribuição enviesada à esquerda
A distribuição da idade de morte na maioria das populações é enviesada para a esquerda: a maioria das pessoas vive até aos 70 e 80 anos, sendo cada vez menos as que vivem menos do que esta idade.
Se criássemos um gráfico de caixa para visualizar a distribuição da idade dos óbitos, este teria o seguinte aspeto:
Repare que a linha vertical dentro da caixa que representa a mediana está muito mais próxima do terceiro quartil do que do primeiro quartil, o que significa que a distribuição é assimétrica à esquerda.
Exemplo 3: Distribuição simétrica
A distribuição da altura dos homens é aproximadamente simétrica e não tem enviesamento. Por exemplo, a altura média de um homem nos Estados Unidos é de cerca de 69,1 polegadas. A distribuição das alturas é aproximadamente simétrica, sendo algumas mais baixas e outras mais altas.
Se criássemos um gráfico de caixa para visualizar a distribuição da altura dos homens nos Estados Unidos, teria o seguinte aspeto:
Repare que a linha vertical no interior da caixa que representa a mediana está igualmente próxima do primeiro quartil e do terceiro quartil, o que significa que a distribuição é simétrica e não tem assimetria.