Pandas DataFrames bieten unglaubliche Flexibilität, aber die Verwaltung der Spaltenreihenfolge ist entscheidend für Lesbarkeit, Analyse und Interoperabilität. Dieser Leitfaden untersucht drei effiziente Methoden zum Neuordnen von DataFrame-Spalten.
Inhaltsverzeichnis
- Methode 1: Direktes Spalten-Neuordnen
- Methode 2: Einfügen von Spalten
- Methode 3: Reindexing für flexible Ordnung
Methode 1: Direktes Spalten-Neuordnen
Dies ist der einfachste Ansatz, ideal wenn Sie die genaue Spaltenreihenfolge kennen. Sie erstellen eine Liste, die die gewünschte Reihenfolge angibt, und verwenden sie, um Spalten aus dem DataFrame auszuwählen.
import pandas as pd
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)
new_order = ['col3', 'col1', 'col2']
df = df[new_order]
print("nNeu geordneter DataFrame:n", df)
Methode 2: Einfügen von Spalten
Verwenden Sie diese Methode, um eine neue Spalte an einer bestimmten Position hinzuzufügen. Dazu gehört das Erstellen der Spalte und die Verwendung der insert
-Methode, um sie korrekt zu positionieren. Der Index in insert
bezieht sich auf die Position der Spalte, nicht auf ihren Namen.
import pandas as pd
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)
df['col4'] = [10, 11, 12]
df.insert(1, 'col4_inserted', df.pop('col4')) # Fügt effizient ein, vermeidet Duplikate
print("nDataFrame mit eingefügter Spalte:n", df)
Methode 3: Reindexing für flexible Ordnung
Die reindex
-Methode bietet die größte Flexibilität. Sie ermöglicht es Ihnen, die gewünschte Reihenfolge anzugeben, und behandelt fehlende Spalten problemlos, indem sie sie mit NaN-Werten füllt.
import pandas as pd
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)
new_order = ['col3', 'col1', 'col4', 'col2'] # 'col4' wird mit NaN-Werten hinzugefügt
df = df.reindex(columns=new_order)
print("nNeu geordneter DataFrame mit reindex:n", df)
Durch die Beherrschung dieser Techniken können Sie die Spaltenreihenfolge in Ihren Pandas DataFrames effizient verwalten und sich an verschiedene Anforderungen der Datenmanipulation anpassen.