Data Wrangling

Pandas DataFrame Spaltenreihenfolge effizient ändern: Drei effektive Methoden

Spread the love

Pandas DataFrames bieten unglaubliche Flexibilität, aber die Verwaltung der Spaltenreihenfolge ist entscheidend für Lesbarkeit, Analyse und Interoperabilität. Dieser Leitfaden untersucht drei effiziente Methoden zum Neuordnen von DataFrame-Spalten.

Inhaltsverzeichnis

Methode 1: Direktes Spalten-Neuordnen

Dies ist der einfachste Ansatz, ideal wenn Sie die genaue Spaltenreihenfolge kennen. Sie erstellen eine Liste, die die gewünschte Reihenfolge angibt, und verwenden sie, um Spalten aus dem DataFrame auszuwählen.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

new_order = ['col3', 'col1', 'col2']
df = df[new_order]
print("nNeu geordneter DataFrame:n", df)

Methode 2: Einfügen von Spalten

Verwenden Sie diese Methode, um eine neue Spalte an einer bestimmten Position hinzuzufügen. Dazu gehört das Erstellen der Spalte und die Verwendung der insert-Methode, um sie korrekt zu positionieren. Der Index in insert bezieht sich auf die Position der Spalte, nicht auf ihren Namen.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

df['col4'] = [10, 11, 12]
df.insert(1, 'col4_inserted', df.pop('col4'))  # Fügt effizient ein, vermeidet Duplikate

print("nDataFrame mit eingefügter Spalte:n", df)

Methode 3: Reindexing für flexible Ordnung

Die reindex-Methode bietet die größte Flexibilität. Sie ermöglicht es Ihnen, die gewünschte Reihenfolge anzugeben, und behandelt fehlende Spalten problemlos, indem sie sie mit NaN-Werten füllt.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

new_order = ['col3', 'col1', 'col4', 'col2']  # 'col4' wird mit NaN-Werten hinzugefügt
df = df.reindex(columns=new_order)
print("nNeu geordneter DataFrame mit reindex:n", df)

Durch die Beherrschung dieser Techniken können Sie die Spaltenreihenfolge in Ihren Pandas DataFrames effizient verwalten und sich an verschiedene Anforderungen der Datenmanipulation anpassen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert