- Exemplo 1: Contar valores duplicados numa coluna
- Exemplo 2: Contagem de linhas duplicadas
- Exemplo 3: Contagem de duplicados para cada linha única
Pode utilizar os seguintes métodos para contar os duplicados numa estrutura de dados em R:
Método 1: Contar valores duplicados numa coluna
sum(duplicado(df$minha_coluna))
Método 2: Contar linhas duplicadas
nrow(df[duplicado(df), ])
Método 3: Contar duplicados para cada linha única
library (dplyr) df %>% group_by_all() %>% count
Os exemplos seguintes mostram como utilizar cada método na prática com a seguinte estrutura de dados em R:
#Criar quadro de dados df = quadro de dados (equipa=c('A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B'), posição=c('G', 'G', 'G', 'F', 'G', 'G', 'F', 'F'), pontos=c(5, 5, 8, 10, 5, 7, 10, 10)) Ver quadro de dados df equipa posição pontos 1 A G 5 2 A G 5 3 A G 8 4 A F 10 5 B G 5 6 B G 7 7 B F 10 8 B F 10
Exemplo 1: Contar valores duplicados numa coluna
O código a seguir mostra como contar o número de valores duplicados na tabela pontos coluna:
#conta o número de valores duplicados na coluna de pontos sum(duplicated(df$points)) 4
Podemos ver que existem 4 valores duplicados no pontos coluna.
Exemplo 2: Contagem de linhas duplicadas
O código a seguir mostra como contar o número de linhas duplicadas no quadro de dados:
#contar o número de linhas duplicadas nrow(df[duplicated(df), ]) 2
Podemos ver que existem 2 linhas duplicadas no quadro de dados.
Podemos utilizar a seguinte sintaxe para visualizar estas 2 linhas duplicadas:
#exibir linhas duplicadas df[duplicated(df), ] posição da equipa pontos 2 A G 5 8 B F 10
Exemplo 3: Contagem de duplicados para cada linha única
O código a seguir mostra como contar o número de duplicados para cada linha única no quadro de dados:
library (dplyr) #contar o número de linhas duplicadas na estrutura de dados df %>% group_by_all() %>% count # Uma tabela: 6 x 4 # Grupos: equipa, posição, pontos equipa posição pontos n 1 A F 10 1 2 A G 5 2 3 A G 8 1 4 B F 10 2 5 B G 5 1 6 B G 7 1
O n exibe o número de duplicatas para cada linha exclusiva.