Les DataFrames Pandas sont essentiels à la manipulation de données en Python. La gestion des en-têtes de colonnes (également appelées noms de colonnes) est une tâche fréquente. Cet article explore diverses techniques pour travailler avec les en-têtes de DataFrame, couvrant des scénarios allant de la création de DataFrames à l’importation de données à partir de fichiers CSV.
Table des matières
- Création de DataFrames avec en-têtes
- Modification des en-têtes existantes
- Gestion des importations CSV
Création de DataFrames avec en-têtes
La façon la plus simple d’ajouter des en-têtes est lors de la création du DataFrame. Ceci est idéal lorsque vous construisez le DataFrame à partir de listes ou de tableaux.
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
Ceci assigne directement les noms de colonnes. L’omission de l’argument columns
entraîne des indices numériques par défaut (0, 1, 2…) comme noms de colonnes.
Modification des en-têtes existantes
Pour les DataFrames dépourvus d’en-têtes ou nécessitant une mise à jour des en-têtes, modifiez l’attribut columns
:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # DataFrame sans en-têtes
df.columns = ['X', 'Y', 'Z']
print(df)
Ceci remplace complètement les noms de colonnes existants. Notez que cette méthode écrase ; elle n’ajoute pas aux en-têtes existantes.
Gestion des importations CSV
La fonction read_csv()
offre un contrôle sur la gestion des en-têtes :
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# Pas de ligne d'en-tête dans le fichier CSV :
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# La première ligne contient l'en-tête :
df2 = pd.read_csv('data.csv', header=0)
print(df2)
header=None
signifie qu’il n’y a pas de ligne d’en-tête ; names
assigne des noms de colonnes personnalisés. header=0
indique que la première ligne est l’en-tête.
Ces techniques offrent une flexibilité dans la gestion des en-têtes de DataFrame, en s’adaptant à diverses structures de données et méthodes d’importation. Choisissez la méthode la mieux adaptée à vos données et à votre tâche.