A Gráfico Q-Q, A abreviatura de gráfico "quantil-quantil", é utilizada para avaliar se um conjunto de dados provém ou não de uma distribuição teórica.

Na maioria dos casos, este tipo de gráfico é utilizado para determinar se um conjunto de dados segue ou não uma distribuição normal.

Se os dados tiverem uma distribuição normal, os pontos de um gráfico Q-Q situar-se-ão numa linha diagonal reta.

Por outro lado, quanto mais os pontos do gráfico se desviarem significativamente de uma linha diagonal reta, menos provável é que o conjunto de dados siga uma distribuição normal.

A forma mais fácil de criar um gráfico Q-Q no SAS é utilizar a função PROC UNIVARIADA juntamente com a declaração QQPLOT declaração:

 proc univariate data =my_data noprint ; qqplot my_variable; run ; 

Os exemplos seguintes mostram como utilizar esta sintaxe na prática.

Nota : Utilizamos o NOPRINT para suprimir todas as outras estatísticas e tabelas de resumo que são geradas automaticamente pelo PROC UNIVARIADA declaração.

Exemplo 1: Criar um gráfico Q-Q no SAS para dados normais

O código seguinte mostra como criar um gráfico Q-Q para um conjunto de dados que contém 1.000 observações geradas a partir de uma distribuição normal com uma média de 10 e um desvio padrão de 2:

 /*gerar 1000 valores que seguem uma distribuição normal com média 10 e sd 2 */ data normal_data; do i = 1 to 1000; x = 10 + 2* rannor (1); output ; end ; run ; /*criar gráfico q-q*/ proc univariate data =normal_data noprint ; qqplot x; run ; 

Podemos ver que os pontos se encontram, na sua maioria, ao longo de uma linha diagonal reta, com alguns desvios menores ao longo de cada uma das caudas.

Com base neste gráfico, podemos assumir com segurança que este conjunto de dados tem uma distribuição normal.

Exemplo 2: Gráfico Q-Q para dados não normais

O código a seguir mostra como criar um gráfico Q-Q para um conjunto de dados que contém 1.000 observações geradas a partir de uma distribuição exponencial:

 /*gerar 1000 valores que seguem uma distribuição exponencial*/ data exp_data; do i = 1 to 1000; x = ranexp (1); output ; end ; run ; /*criar gráfico q-q*/ proc univariate data =exp_data noprint ; qqplot x; run ; 

Podemos ver que os pontos se desviam significativamente de uma linha diagonal reta, o que é uma indicação clara de que o conjunto de dados não tem uma distribuição normal.

Isto deve fazer sentido, uma vez que especificámos que os dados devem seguir uma distribuição exponencial.