Data Science

Pandas DataFrames meistern: Effizientes Header-Management

Spread the love

Pandas DataFrames sind essentiell für die Datenmanipulation in Python. Die Verwaltung von Spaltenüberschriften (auch Spaltennamen genannt) ist eine häufige Aufgabe. Dieser Artikel untersucht verschiedene Techniken zum Arbeiten mit DataFrame-Überschriften, die Szenarien von der Erstellung von DataFrames bis zum Import von Daten aus CSV-Dateien abdecken.

Inhaltsverzeichnis

DataFrames mit Überschriften erstellen

Die einfachste Möglichkeit, Überschriften hinzuzufügen, ist während der DataFrame-Erstellung. Dies ist ideal, wenn Sie den DataFrame aus Listen oder Arrays erstellen.


import pandas as pd

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)

Dies weist die Spaltennamen direkt zu. Das Weglassen des Arguments columns führt zu standardmäßigen numerischen Indizes (0, 1, 2…) als Spaltennamen.

Vorhandene Überschriften ändern

Für DataFrames ohne Überschriften oder bei Bedarf von Überschriftenaktualisierungen, ändern Sie das Attribut columns:


import pandas as pd

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data)  # DataFrame ohne Überschriften
df.columns = ['X', 'Y', 'Z']
print(df)

Dies ersetzt die vorhandenen Spaltennamen vollständig. Beachten Sie, dass diese Methode überschreibt; sie hängt nicht an vorhandenen Überschriften an.

CSV-Importe verarbeiten

Die Funktion read_csv() bietet Kontrolle über die Behandlung von Überschriften:


import pandas as pd

# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9

# Keine Überschriftenzeile in der CSV-Datei:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)

# Erste Zeile enthält die Überschrift:
df2 = pd.read_csv('data.csv', header=0) 
print(df2)

header=None bedeutet keine Überschriftenzeile; names weist benutzerdefinierte Spaltennamen zu. header=0 gibt an, dass die erste Zeile die Überschrift ist.

Diese Techniken bieten Flexibilität bei der Verwaltung von DataFrame-Überschriften und passen sich an verschiedene Datenstrukturen und Importmethoden an. Wählen Sie die Methode, die am besten zu Ihren Daten und Ihrer Aufgabe passt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert