É possível utilizar o usecols dentro do argumento read_csv() para ler colunas específicas de um ficheiro CSV para um DataFrame do pandas.
Há duas formas comuns de utilizar este argumento:
Método 1: Utilizar usecols com nomes de colunas
df = pd. read_csv (' my_data.csv ', usecols=[' this_column ', ' that_column '])
Método 2: Utilizar usecols com posições de coluna
df = pd. read_csv (' meus_dados.csv ', usecols=[ 0 , 2 ])
Os exemplos seguintes mostram como utilizar cada método na prática com o seguinte ficheiro CSV chamado dados_de_basquetebol.csv :
Exemplo 1: Utilizar usecols com nomes de colunas
Podemos utilizar o seguinte código para importar o ficheiro CSV e utilizar apenas as colunas "equipa" e "ressaltos":
importar pandas as pd #importar DataFrame e utilizar apenas as colunas 'team' e 'rebounds' df = pd. read_csv (' basketball_data.csv ', usecols=[' team ', ' rebounds ']) #Ver DataFrame print (df) equipa recupera 0 A 10 1 B 9 2 C 6 3 D 2
Repare que apenas as colunas da equipa e dos ressaltos foram importadas, uma vez que estes eram os nomes das colunas que especificámos no usecols argumento.
Exemplo 2: Utilizar usecols com posições de coluna
Podemos utilizar o seguinte código para importar o ficheiro CSV e utilizar apenas as colunas nas posições de índice 0 e 2:
importar pandas as pd #importar DataFrame e utilizar apenas colunas nas posições de índice 0 e 2 df = pd. read_csv (' basketball_data.csv ', usecols=[ 0 , 2 ]) #Ver DataFrame print (df) equipa recupera 0 A 10 1 B 9 2 C 6 3 D 2
Repare que apenas as colunas da equipa e dos ressaltos foram importadas, uma vez que estas eram as colunas nas posições de índice 0 e 2, que são os valores que especificámos no usecols argumento.
Nota A primeira coluna do ficheiro CSV tem uma posição de índice 0.