R-quadrado , muitas vezes escrito como r2, é uma medida de quão bem um modelo de regressão linear se ajusta a um conjunto de dados.

Em termos técnicos, é a proporção da variância na variável de resposta que pode ser explicada pela variável de previsão.

O valor de r2 pode variar entre 0 e 1:

  • Um valor de 0 indica que a variável de resposta não pode ser explicada de todo pela variável preditora.
  • Um valor de 1 indica que a variável de resposta pode ser perfeitamente explicada sem erros pela variável preditora.

O exemplo seguinte mostra como calcular o R-quadrado para duas variáveis no Google Sheets.

Exemplo: Como calcular o R-quadrado no Google Sheets

Suponhamos que temos os seguintes dados relativos ao número de horas de estudo e à nota do exame de 20 alunos:

Agora, suponhamos que queremos ajustar um modelo de regressão linear simples, utilizando "horas" como variável preditora e "pontuação" como variável de resposta.

Para encontrar o R-quadrado para este modelo, podemos utilizar o RSQ() no Google Sheets, que utiliza a seguinte sintaxe:

=RSQ(conhecidos_ys, conhecidos_xs)

onde:

  • conhecido_ys: os valores da variável de resposta
  • conhecido_xs: os valores da variável preditora

No nosso exemplo, podemos escrever a seguinte fórmula na célula D2:

 =RSQ( A2:A21 , B2:B21 ) 

A imagem de ecrã seguinte mostra como utilizar esta fórmula na prática:

O valor R-quadrado é de cerca de 0.7273 .

Isto significa que 72.73% da variação nas notas dos exames pode ser explicada pelo número de horas estudadas.

Relacionadas: O que é um bom valor R-quadrado?