Data Wrangling

Maîtriser le Réarrangement des Colonnes d’un DataFrame Pandas : Trois Méthodes Efficaces

Spread the love

Les DataFrames Pandas offrent une flexibilité incroyable, mais la gestion de l’ordre des colonnes est cruciale pour la lisibilité, l’analyse et l’interopérabilité. Ce guide explore trois méthodes efficaces pour réorganiser les colonnes d’un DataFrame.

Table des matières

Méthode 1 : Réorganisation directe des colonnes

Il s’agit de l’approche la plus simple, idéale lorsque vous connaissez l’ordre précis des colonnes. Vous créez une liste spécifiant la séquence souhaitée et vous l’utilisez pour sélectionner les colonnes du DataFrame.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame original :n", df)

new_order = ['col3', 'col1', 'col2']
df = df[new_order]
print("nDataFrame réorganisé :n", df)

Méthode 2 : Insertion de colonnes

Utilisez cette méthode pour ajouter une nouvelle colonne à un emplacement spécifique. Cela implique de créer la colonne et d’utiliser la méthode insert pour la positionner correctement. L’index dans insert fait référence à la position de la colonne, et non à son nom.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame original :n", df)

df['col4'] = [10, 11, 12]
df.insert(1, 'col4_inserted', df.pop('col4'))  # Insertion efficace, évite la duplication

print("nDataFrame avec colonne insérée :n", df)

Méthode 3 : Réindexation pour un ordre flexible

La méthode reindex offre la plus grande flexibilité. Elle vous permet de spécifier l’ordre souhaité, et gère élégamment les colonnes manquantes en les remplissant avec des valeurs NaN.


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print("DataFrame original :n", df)

new_order = ['col3', 'col1', 'col4', 'col2']  # 'col4' sera ajoutée avec des valeurs NaN
df = df.reindex(columns=new_order)
print("nDataFrame réorganisé avec reindex :n", df)

En maîtrisant ces techniques, vous pouvez gérer efficacement l’ordre des colonnes dans vos DataFrames Pandas, en vous adaptant aux différents besoins de manipulation de données.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *