A transformação box-cox é um método comummente utilizado para transformar um conjunto de dados com uma distribuição não normal num conjunto de dados com uma distribuição mais normal.

A ideia básica é encontrar um valor para λ de modo a que os dados transformados se aproximem o mais possível de uma distribuição normal, utilizando a seguinte fórmula:

  • y(λ) = (yλ - 1) / λ se y ≠ 0
  • y(λ) = log(y) se y = 0

O exemplo passo-a-passo seguinte mostra como efetuar uma transformação box-cox num conjunto de dados no Excel.

Passo 1: Introduzir os dados

Primeiro, vamos introduzir os valores para um conjunto de dados:

Passo 2: Ordenar os dados

Em seguida, crie uma coluna de índice e uma coluna de dados ordenados:

Etapa 3: Escolha um valor arbitrário para Lambda

De seguida, vamos escolher um valor arbitrário de 1 para lambda e aplicar uma transformação box-cox temporária aos dados:

Etapa 4: Calcular os escores Z

Em seguida, calcularemos o escore z para cada valor no índice:

Em seguida, calcularemos a correlação entre os valores transformados em box-cox e os escores-z:

Passo 5: Encontrar o valor Lambda ótimo

Em seguida, utilizaremos o Goal Seek para encontrar o valor lambda ótimo a utilizar na transformação box-cox.

Para o fazer, clique no botão Dados na faixa de opções superior. Em seguida, clique em Análise de hipóteses dentro do Previsão grupo.

No menu suspenso, clique em Procura de objectivos e preencha os seguintes valores:

Depois de clicar em OK , o Goal Seek encontrará automaticamente o valor lambda ótimo para ser -0.5225 .

Passo 6: Efetuar a transformação Box-Cox

Por fim, aplicaremos a transformação box-cox aos dados originais, utilizando um valor lambda de -0,5225:

Bónus: Podemos confirmar que os dados transformados têm uma distribuição normal efectuando um teste Jarque-Bera no Excel.