Pode utilizar os seguintes métodos para contar os duplicados numa estrutura de dados em R:

Método 1: Contar valores duplicados numa coluna

 sum(duplicado(df$minha_coluna)) 

Método 2: Contar linhas duplicadas

 nrow(df[duplicado(df), ]) 

Método 3: Contar duplicados para cada linha única

 library (dplyr) df %>% group_by_all() %>% count 

Os exemplos seguintes mostram como utilizar cada método na prática com a seguinte estrutura de dados em R:

 #Criar quadro de dados df = quadro de dados (equipa=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'), posição=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'), pontos=c(5, 5, 8, 10, 5, 7, 10, 10)) Ver quadro de dados df equipa posição pontos 1 A G 5 2 A G 5 3 A G 8 4 A F 10 5 B G 5 6 B G 7 7 B F 10 8 B F 10 

Exemplo 1: Contar valores duplicados numa coluna

O código a seguir mostra como contar o número de valores duplicados na tabela pontos coluna:

 #conta o número de valores duplicados na coluna de pontos sum(duplicated(df$points)) 4 

Podemos ver que existem 4 valores duplicados no pontos coluna.

Exemplo 2: Contagem de linhas duplicadas

O código a seguir mostra como contar o número de linhas duplicadas no quadro de dados:

 #contar o número de linhas duplicadas nrow(df[duplicated(df), ]) 2 

Podemos ver que existem 2 linhas duplicadas no quadro de dados.

Podemos utilizar a seguinte sintaxe para visualizar estas 2 linhas duplicadas:

 #exibir linhas duplicadas df[duplicated(df), ] posição da equipa pontos 2 A G 5 8 B F 10 

Exemplo 3: Contagem de duplicados para cada linha única

O código a seguir mostra como contar o número de duplicados para cada linha única no quadro de dados:

 library (dplyr) #contar o número de linhas duplicadas na estrutura de dados df %>% group_by_all() %>% count # Uma tabela: 6 x 4 # Grupos: equipa, posição, pontos equipa posição pontos n 1 A F 10 1 2 A G 5 2 3 A G 8 1 4 B F 10 2 5 B G 5 1 6 B G 7 1 

O n exibe o número de duplicatas para cada linha exclusiva.