Data Science

Pandas meistern: Drei Wege zur Umbenennung von DataFrame-Spalten

Spread the love

Pandas DataFrames sind essentiell für die Datenmanipulation in Python. Oftmals müssen Spaltennamen zur Verbesserung der Klarheit, Konsistenz oder Kompatibilität mit anderen Datensätzen angepasst werden. Pandas bietet mehrere effiziente Methoden, um dies zu erreichen. Dieser Artikel untersucht drei gängige Ansätze: die Verwendung von DataFrame.rename(), DataFrame.columns und DataFrame.set_axis().

Inhaltsverzeichnis

Umbenennen von Spalten mit DataFrame.rename()

Die Methode rename() bietet die größte Flexibilität und ermöglicht das selektive Umbenennen einzelner Spalten oder Spaltengruppen. Sie verwendet ein Dictionary, wobei die Schlüssel die alten Spaltennamen und die Werte die neuen Namen darstellen.


import pandas as pd

# Beispiel DataFrame
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

# Spalten umbenennen mit DataFrame.rename()
df = df.rename(columns={'old_col1': 'new_col1', 'old_col3': 'new_col3'})
print("nDataFrame nach Umbenennung:n", df)

# Umbenennung direkt mit inplace=True
df.rename(columns={'old_col2': 'new_col2'}, inplace=True)
print("nDataFrame nach direkter Umbenennung:n", df)

Dieser Code-Schnipsel benennt selektiv ‚old_col1′ in ’new_col1‘ und ‚old_col3′ in ’new_col3‘ um. Das Argument inplace=True modifiziert den DataFrame direkt und macht eine erneute Zuweisung überflüssig.

Umbenennen von Spalten mit DataFrame.columns

Diese Methode bietet einen unkomplizierten Ansatz zum gleichzeitigen Umbenennen aller Spalten. Sie weist der Eigenschaft columns direkt eine neue Liste von Spaltennamen zu. Diese Methode ist prägnant, aber weniger flexibel für selektive Umbenennungen.


import pandas as pd

# Beispiel DataFrame
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

# Spalten umbenennen mit DataFrame.columns
new_columns = ['new_col1', 'new_col2', 'new_col3']
df.columns = new_columns
print("nDataFrame nach Umbenennung:n", df)

Der Code erstellt eine Liste new_columns mit den gewünschten Namen und weist sie df.columns zu. Wichtig ist, dass die Länge von new_columns genau mit der Anzahl der Spalten im DataFrame übereinstimmen muss.

Umbenennen von Spalten mit DataFrame.set_axis()

Die Methode set_axis() bietet eine Alternative zum gleichzeitigen Umbenennen aller Spalten. Sie ähnelt DataFrame.columns, gibt aber die Achse explizit an (1 für Spalten, 0 für Zeilen).


import pandas as pd

# Beispiel DataFrame
data = {'old_col1': [1, 2, 3], 'old_col2': [4, 5, 6], 'old_col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("Original DataFrame:n", df)

# Spalten umbenennen mit DataFrame.set_axis()
new_columns = ['new_col1', 'new_col2', 'new_col3']
df = df.set_axis(new_columns, axis=1)
print("nDataFrame nach Umbenennung:n", df)

Dieses Beispiel verwendet set_axis() mit axis=1, um alle Spalten umzubenennen. Wie DataFrame.columns ersetzt es alle Spaltennamen.

Zusammenfassend lässt sich sagen, dass jede Methode einen einzigartigen Ansatz bietet. DataFrame.rename() eignet sich am besten zum selektiven Umbenennen, während DataFrame.columns und DataFrame.set_axis() effizient zum Umbenennen aller Spalten sind. Wählen Sie die Methode, die am besten zu Ihren spezifischen Bedürfnissen passt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert