Pandas DataFrame — незаменимый инструмент для обработки данных в Python. Управление заголовками столбцов (также известными как имена столбцов) — частая задача. Эта статья рассматривает различные методы работы с заголовками DataFrame, охватывая сценарии от создания DataFrame до импорта данных из CSV-файлов.
Оглавление
Создание DataFrame с заголовками
Простейший способ добавить заголовки — сделать это при создании DataFrame. Это идеально подходит, когда вы создаёте DataFrame из списков или массивов.
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
Это напрямую присваивает имена столбцам. Если опустить аргумент columns
, в качестве имён столбцов будут использоваться числовые индексы по умолчанию (0, 1, 2…).
Изменение существующих заголовков
Для DataFrame, у которых отсутствуют заголовки или требуется их обновление, измените атрибут columns
:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # DataFrame без заголовков
df.columns = ['X', 'Y', 'Z']
print(df)
Это полностью заменяет существующие имена столбцов. Обратите внимание, что этот метод перезаписывает; он не добавляет к существующим заголовкам.
Обработка импорта CSV
Функция read_csv()
предоставляет контроль над обработкой заголовков:
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# Строка заголовка отсутствует в CSV-файле:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# Первая строка содержит заголовок:
df2 = pd.read_csv('data.csv', header=0)
print(df2)
header=None
означает отсутствие строки заголовка; names
присваивает пользовательские имена столбцов. header=0
указывает, что первая строка является заголовком.
Эти методы обеспечивают гибкость в управлении заголовками DataFrame, адаптируясь к различным структурам данных и методам импорта. Выберите метод, наиболее подходящий для ваших данных и задачи.