تُعدّ جداول بيانات Pandas (Pandas DataFrames) أساسيةً في معالجة البيانات في بايثون. ويمثل إدارة عناوين الأعمدة (المعروفة أيضًا بأسماء الأعمدة) مهمةً متكررة. تستعرض هذه المقالة تقنيات متنوعة للعمل مع عناوين جداول البيانات، شاملةً سيناريوهات تتراوح من إنشاء جداول البيانات إلى استيراد البيانات من ملفات CSV.
محتويات الجدول
إنشاء جداول بيانات بعناوين
أبسط طريقة لإضافة عناوين هي أثناء إنشاء جدول البيانات. وهذا مثالي عندما تقوم ببناء جدول البيانات من قوائم أو مصفوفات.
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
يُعيّن هذا أسماء الأعمدة مباشرةً. يؤدي حذف وسيطة columns
إلى استخدام مؤشرات رقمية افتراضية (0، 1، 2…) كأسماء أعمدة.
تعديل العناوين الموجودة
بالنسبة لجداول البيانات التي تفتقر إلى عناوين أو تحتاج إلى تحديثات في العناوين، قم بتعديل سمة columns
:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # جدول بيانات بدون عناوين
df.columns = ['X', 'Y', 'Z']
print(df)
يستبدل هذا أسماء الأعمدة الموجودة بالكامل. لاحظ أن هذه الطريقة تقوم بالكتابة فوق؛ فهي لا تضيف إلى العناوين الموجودة.
معالجة استيراد ملفات CSV
توفر دالة read_csv()
تحكمًا في معالجة العناوين:
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# لا يوجد صف عنوان في ملف CSV:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# الصف الأول يحتوي على العنوان:
df2 = pd.read_csv('data.csv', header=0)
print(df2)
تشير header=None
إلى عدم وجود صف عنوان؛ وnames
تعيّن أسماء أعمدة مخصصة. تشير header=0
إلى أن الصف الأول هو العنوان.
توفر هذه التقنيات مرونة في إدارة عناوين جداول البيانات، مع التكيّف مع مختلف هياكل البيانات وطرق الاستيراد. اختر الطريقة الأنسب لبياناتك ومهمتك.