Pode utilizar os seguintes métodos para verificar se uma coluna de um quadro de dados em R contém uma cadeia de caracteres:

Método 1: Verificar se a cadeia de caracteres exacta existe na coluna

 sum(str_detect(df$nome_da_coluna, ' ^exact_string$ '))> 0 

Método 2: Verificar se existe uma cadeia de caracteres parcial na coluna

 sum(str_detect(df$nome_da_coluna, ' partial_string '))> 0 

Método 3: Contar as ocorrências de uma cadeia de caracteres parcial em Coluna

 sum(str_detect(df$nome_da_coluna, ' partial_string ')) 

Este tutorial explica como utilizar cada método na prática com o seguinte quadro de dados:

 #create data frame df <- data. frame (team=c('A', 'A', 'A', 'B', 'B', 'C'), conf=c('East', 'East', 'South', 'West', 'West', 'East'), points=c(11, 14, 15, 15, 14, 19)) #view data frame df team conf points 1 A East 11 2 A East 14 3 A South 15 4 B West 15 5 B West 14 6 C East 19 

Exemplo 1: Verificar se existe uma cadeia de caracteres exacta na coluna

O código a seguir mostra como verificar se a string exata 'Eas' existe no conf coluna do quadro de dados:

 #verificar se a cadeia exacta 'Eas' existe na coluna conf sum(str_detect(df$conf, ' ^Eas$ '))> 0 FALSE 

A saída retorna FALSO .

Isto diz-nos que a cadeia exacta 'Eas' não existe no conf coluna.

Nota Utilizámos símbolos regex para indicar o início ( ^ ) e fim ( $ ) da cadeia de caracteres que estávamos a procurar.

Exemplo 2: Verificar se existe uma cadeia parcial na coluna

O código a seguir mostra como verificar se a string parcial 'Eas' existe no conf coluna do quadro de dados:

 #verifica se a cadeia parcial 'Eas' existe na coluna conf sum(str_detect(df$conf, ' Eas '))> 0 TRUE 

A saída retorna VERDADEIRO .

Isto diz-nos que a cadeia parcial 'Eas' existe de facto no conf coluna do quadro de dados.

Exemplo 3: Contagem de ocorrências de uma cadeia parcial numa coluna

O código a seguir mostra como contar o número de vezes que a string parcial 'Eas' ocorre no conf coluna do quadro de dados:

 #contar as ocorrências da cadeia parcial 'Eas' na coluna conf sum(str_detect(df$conf, ' Eas ')) 3 

A saída retorna 3 .

Isto diz-nos que a cadeia parcial 'Eas' ocorre 3 vezes no conf coluna do quadro de dados.

Relacionadas: Como utilizar a função str_detect() em R