É possível utilizar a seguinte sintaxe básica para ler apenas linhas específicas de um ficheiro CSV para um DataFrame do pandas:
#especificar as linhas a importar linhas_específicas = [ 0 , 2 , 3 ] #importar linhas específicas de CSV para DataFrame df = pd. read_csv (' meus_dados.csv ', skiprows = lambda x: x not in linhas_específicas)
Este exemplo específico irá ler as linhas nas posições de índice 0, 2 e 3 de um ficheiro CSV chamado meus_dados.csv para um DataFrame do pandas.
O exemplo seguinte mostra como utilizar esta sintaxe na prática.
Exemplo: Ler apenas linhas específicas de um ficheiro CSV para o Pandas
Suponhamos que temos o seguinte ficheiro CSV chamado dados_de_basquetebol.csv :
Se utilizarmos o read_csv() o pandas importará automaticamente cada linha do ficheiro CSV para um DataFrame:
importar pandas como pd #importar todas as linhas do CSV para o DataFrame df = pd. read_csv (' basketball_data.csv ') #ver DataFrame print (df) equipa pontos ressaltos 0 A 22 10 1 B 14 9 2 C 29 6 3 D 30 2
No entanto, podemos utilizar a seguinte sintaxe para importar apenas as linhas nas posições de índice 0, 2 e 3 do ficheiro CSV para um DataFrame do pandas:
importar pandas como pd #especificar as linhas a importar linhas_específicas = [ 0 , 2 , 3 ] #importar linhas específicas do CSV para a DataFrame df = pd. read_csv (' basketball_data.csv ', skiprows = lambda x: x not in linhas_específicas) #ver DataFrame print (df) equipa pontos ressaltos 0 B 14 9 1 C 29 6
Repare que apenas as linhas nas posições de índice 0, 2 e 3 do ficheiro CSV são importadas para o DataFrame.
Esta sintaxe utiliza o linhas de saltos e um argumento lambda para dizer ao pandas quais as linhas não saltar ao importar o ficheiro CSV.
Neste exemplo, dizemos ao pandas para não saltar as linhas nas posições de índice 0, 2 e 3, mas para saltar todas as outras linhas ao importar o ficheiro CSV.
Nota : Pode encontrar a documentação completa para a aplicação pandas read_csv() função aqui.