DataFrames Pandas são essenciais para manipulação de dados em Python. Gerenciar cabeçalhos de coluna (também conhecidos como nomes de colunas) é uma tarefa frequente. Este artigo explora várias técnicas para trabalhar com cabeçalhos de DataFrame, cobrindo cenários desde a criação de DataFrames até a importação de dados de arquivos CSV.
Sumário
Criando DataFrames com Cabeçalhos
A maneira mais simples de adicionar cabeçalhos é durante a criação do DataFrame. Isso é ideal quando você está construindo o DataFrame a partir de listas ou arrays.
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
Isso atribui diretamente os nomes das colunas. Omitir o argumento columns
resulta em índices numéricos padrão (0, 1, 2…) como nomes de colunas.
Modificando Cabeçalhos Existentes
Para DataFrames sem cabeçalhos ou que precisam de atualizações de cabeçalho, modifique o atributo columns
:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # DataFrame sem cabeçalhos
df.columns = ['X', 'Y', 'Z']
print(df)
Isso substitui completamente os nomes das colunas existentes. Observe que este método sobrescreve; ele não anexa aos cabeçalhos existentes.
Lidando com Importações CSV
A função read_csv()
oferece controle sobre o tratamento de cabeçalhos:
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# Nenhuma linha de cabeçalho no arquivo CSV:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# A primeira linha contém o cabeçalho:
df2 = pd.read_csv('data.csv', header=0)
print(df2)
header=None
significa que não há linha de cabeçalho; names
atribui nomes de colunas personalizados. header=0
indica que a primeira linha é o cabeçalho.
Essas técnicas oferecem flexibilidade na gestão de cabeçalhos de DataFrame, adaptando-se a várias estruturas de dados e métodos de importação. Selecione o método mais adequado aos seus dados e tarefa.