Data Wrangling

Dominando Índices Pandas: Convertendo entre Índices e Colunas

Spread the love

DataFrames Pandas são um elemento fundamental na manipulação de dados em Python. Seus índices frequentemente contêm informações cruciais que você pode querer integrar como colunas. Este artigo detalha várias técnicas para converter o índice de um DataFrame em uma coluna, e vice-versa.

Sumário:

  1. Adicionando o Índice como uma Nova Coluna
  2. Renomeando a Coluna de Índice Após a Conversão
  3. Convertendo uma Coluna para o Índice
  4. Trabalhando com Estruturas MultiIndex

1. Adicionando o Índice como uma Nova Coluna

O método mais direto usa o atributo .index:


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

df['index_col'] = df.index
print(df)

Isso atribui diretamente os valores do índice a uma nova coluna chamada ‘index_col’.

2. Renomeando a Coluna de Índice Após a Conversão

O método reset_index() transforma o índice em uma coluna, usando ‘index’ como padrão. Use rename_axis() para nomeação personalizada:


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

df = df.rename_axis('original_index').reset_index()
print(df)

Isso renomeia a coluna de índice resultante para ‘original_index’.

3. Convertendo uma Coluna para o Índice

Para realizar a operação inversa, utilize set_index():


import pandas as pd

data = {'index_col': [0, 1, 2], 'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

df = df.set_index('index_col')
print(df)

Isso define ‘index_col’ como o novo índice do DataFrame.

4. Trabalhando com Estruturas MultiIndex

Para cenários mais complexos envolvendo múltiplos níveis de índice, um MultiIndex é benéfico. Vamos criar um MultiIndex a partir de colunas existentes, e então redefini-lo para adicionar os níveis como colunas:


import pandas as pd

data = {'level1': ['A', 'A', 'B', 'B'], 'level2': ['X', 'Y', 'X', 'Y'], 'value': [1, 2, 3, 4]}
df = pd.DataFrame(data)

df = df.set_index(['level1', 'level2']).reset_index()
print(df)

Isso cria e então converte um MultiIndex em colunas separadas.

Estas técnicas oferecem versatilidade na gestão de índices de DataFrame, permitindo a integração perfeita de informações de índice como colunas, ou vice-versa, adaptadas às suas necessidades específicas de análise de dados.

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *