Data Science

Dominando Pandas: Três Maneiras de Renomear Colunas de DataFrame

Spread the love

DataFrames Pandas são essenciais para manipulação de dados em Python. Frequentemente, você precisará ajustar os nomes das colunas para melhor clareza, consistência ou compatibilidade com outros conjuntos de dados. Pandas oferece vários métodos eficientes para alcançar isso. Este artigo explora três abordagens populares: usando DataFrame.rename(), DataFrame.columns e DataFrame.set_axis().

Sumário

Renomeando Colunas com DataFrame.rename()

O método rename() fornece a maior flexibilidade, permitindo que você renomeie colunas individuais ou grupos de colunas seletivamente. Ele usa um dicionário onde as chaves representam os nomes antigos das colunas e os valores representam seus novos nomes.


import pandas as pd

# DataFrame de exemplo
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame Original:n", df)

# Renomear colunas usando DataFrame.rename()
df = df.rename(columns={'old_col1': 'new_col1', 'old_col3': 'new_col3'})
print("nDataFrame após renomeação:n", df)

# Renomeando no lugar usando inplace=True
df.rename(columns={'old_col2': 'new_col2'}, inplace=True)
print("nDataFrame após renomeação no lugar:n", df)

Este trecho de código renomeia seletivamente ‘old_col1’ para ‘new_col1’ e ‘old_col3’ para ‘new_col3’. O argumento inplace=True modifica o DataFrame diretamente, eliminando a necessidade de reatribuição.

Renomeando Colunas com DataFrame.columns

Este método oferece uma abordagem direta para renomear todas as colunas simultaneamente. Ele atribui diretamente uma nova lista de nomes de colunas ao atributo columns. Este método é conciso, mas carece de flexibilidade para renomeação seletiva.


import pandas as pd

# DataFrame de exemplo
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame Original:n", df)

# Renomear colunas usando DataFrame.columns
new_columns = ['new_col1', 'new_col2', 'new_col3']
df.columns = new_columns
print("nDataFrame após renomeação:n", df)

O código cria uma lista new_columns com os nomes desejados e a atribui a df.columns. É crucial que o comprimento de new_columns corresponda exatamente ao número de colunas no DataFrame.

Renomeando Colunas com DataFrame.set_axis()

O método set_axis() fornece uma alternativa para renomear todas as colunas de uma vez. É semelhante a DataFrame.columns, mas especifica explicitamente o eixo (1 para colunas, 0 para linhas).


import pandas as pd

# DataFrame de exemplo
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame Original:n", df)

# Renomear colunas usando DataFrame.set_axis()
new_columns = ['new_col1', 'new_col2', 'new_col3']
df = df.set_axis(new_columns, axis=1)
print("nDataFrame após renomeação:n", df)

Este exemplo usa set_axis() com axis=1 para renomear todas as colunas. Assim como DataFrame.columns, ele substitui todos os nomes das colunas.

Em resumo, cada método oferece uma abordagem única. DataFrame.rename() é ideal para renomeação seletiva, enquanto DataFrame.columns e DataFrame.set_axis() são eficientes para renomear todas as colunas. Escolha o método que melhor se adapta às suas necessidades específicas.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *