Los DataFrames de Pandas son esenciales para la manipulación de datos en Python. Gestionar los encabezados de columna (también conocidos como nombres de columna) es una tarea frecuente. Este artículo explora varias técnicas para trabajar con encabezados de DataFrame, cubriendo escenarios desde la creación de DataFrames hasta la importación de datos desde archivos CSV.
Tabla de contenido
Creando DataFrames con encabezados
La forma más sencilla de agregar encabezados es durante la creación del DataFrame. Esto es ideal cuando se construye el DataFrame a partir de listas o matrices.
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
Esto asigna directamente los nombres de las columnas. Omitir el argumento columns
resulta en índices numéricos predeterminados (0, 1, 2…) como nombres de columna.
Modificando encabezados existentes
Para DataFrames que carecen de encabezados o que necesitan actualizaciones de encabezados, modifique el atributo columns
:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # DataFrame sin encabezados
df.columns = ['X', 'Y', 'Z']
print(df)
Esto reemplaza completamente los nombres de las columnas existentes. Tenga en cuenta que este método sobrescribe; no agrega a los encabezados existentes.
Gestionando importaciones CSV
La función read_csv()
ofrece control sobre el manejo de encabezados:
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# Sin fila de encabezado en el archivo CSV:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# La primera fila contiene el encabezado:
df2 = pd.read_csv('data.csv', header=0)
print(df2)
header=None
significa que no hay una fila de encabezado; names
asigna nombres de columna personalizados. header=0
indica que la primera fila es el encabezado.
Estas técnicas ofrecen flexibilidad en la gestión de encabezados de DataFrame, adaptándose a diversas estructuras de datos y métodos de importación. Seleccione el método más adecuado para sus datos y tarea.