- Exemplo 1: Verificar se existe uma cadeia de caracteres exacta na coluna
- Exemplo 2: Verificar se existe uma cadeia parcial na coluna
- Exemplo 3: Contagem de ocorrências de uma cadeia parcial numa coluna
Pode utilizar os seguintes métodos para verificar se uma coluna de um quadro de dados em R contém uma cadeia de caracteres:
Método 1: Verificar se a cadeia de caracteres exacta existe na coluna
sum(str_detect(df$nome_da_coluna, ' ^exact_string$ '))> 0
Método 2: Verificar se existe uma cadeia de caracteres parcial na coluna
sum(str_detect(df$nome_da_coluna, ' partial_string '))> 0
Método 3: Contar as ocorrências de uma cadeia de caracteres parcial em Coluna
sum(str_detect(df$nome_da_coluna, ' partial_string '))
Este tutorial explica como utilizar cada método na prática com o seguinte quadro de dados:
#create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'), conf=c('East', 'East', 'South', 'West', 'West', 'East'), points=c(11, 14, 15, 15, 14, 19)) #view data frame df team conf points 1 A East 11 2 A East 14 3 A South 15 4 B West 15 5 B West 14 6 C East 19
Exemplo 1: Verificar se existe uma cadeia de caracteres exacta na coluna
O código a seguir mostra como verificar se a string exata 'Eas' existe no conf coluna do quadro de dados:
#verificar se a cadeia exacta 'Eas' existe na coluna conf sum(str_detect(df$conf, ' ^Eas$ '))> 0 FALSE
A saída retorna FALSO .
Isto diz-nos que a cadeia exacta 'Eas' não existe no conf coluna.
Nota Utilizámos símbolos regex para indicar o início ( ^ ) e fim ( $ ) da cadeia de caracteres que estávamos a procurar.
Exemplo 2: Verificar se existe uma cadeia parcial na coluna
O código a seguir mostra como verificar se a string parcial 'Eas' existe no conf coluna do quadro de dados:
#verifica se a cadeia parcial 'Eas' existe na coluna conf sum(str_detect(df$conf, ' Eas '))> 0 TRUE
A saída retorna VERDADEIRO .
Isto diz-nos que a cadeia parcial 'Eas' existe de facto no conf coluna do quadro de dados.
Exemplo 3: Contagem de ocorrências de uma cadeia parcial numa coluna
O código a seguir mostra como contar o número de vezes que a string parcial 'Eas' ocorre no conf coluna do quadro de dados:
#contar as ocorrências da cadeia parcial 'Eas' na coluna conf sum(str_detect(df$conf, ' Eas ')) 3
A saída retorna 3 .
Isto diz-nos que a cadeia parcial 'Eas' ocorre 3 vezes no conf coluna do quadro de dados.
Relacionadas: Como utilizar a função str_detect() em R