Data Wrangling

Три эффективных способа перестановки столбцов в Pandas DataFrame

Spread the love

DataFrames в Pandas предлагают невероятную гибкость, но управление порядком столбцов имеет решающее значение для читаемости, анализа и взаимодействия. В этом руководстве рассматриваются три эффективных метода перестановки столбцов DataFrame.

Содержание

Метод 1: Прямая перестановка столбцов

Это самый простой подход, идеально подходящий, когда вам известен точный порядок столбцов. Вы создаете список, указывающий желаемую последовательность, и используете его для выбора столбцов из DataFrame.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Исходный DataFrame:n", df)

new_order = ['col3', 'col1', 'col2']
df = df[new_order]
print("nПереупорядоченный DataFrame:n", df)

Метод 2: Вставка столбцов

Используйте этот метод для добавления нового столбца в определенное место. Это включает в себя создание столбца и использование метода insert для его правильного позиционирования. Индекс в insert относится к позиции столбца, а не к его имени.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Исходный DataFrame:n", df)

df['col4'] = [10, 11, 12]
df.insert(1, 'col4_inserted', df.pop('col4'))  # Эффективно вставляет, избегая дублирования

print("nDataFrame с вставленным столбцом:n", df)

Метод 3: Переиндексация для гибкого упорядочивания

Метод reindex предлагает максимальную гибкость. Он позволяет указать желаемый порядок, и он корректно обрабатывает отсутствующие столбцы, заполняя их значениями NaN.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Исходный DataFrame:n", df)

new_order = ['col3', 'col1', 'col4', 'col2']  # 'col4' будет добавлен со значениями NaN
df = df.reindex(columns=new_order)
print("nПереупорядоченный DataFrame с помощью reindex:n", df)

Овладев этими методами, вы сможете эффективно управлять порядком столбцов в ваших Pandas DataFrames, адаптируясь к различным потребностям обработки данных.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *