Pandas مكتبة قوية في بايثون لمعالجة البيانات وتحليلها، وحساب مجموع قيم الأعمدة مهمة شائعة الاستخدام. تستعرض هذه المقالة طرقًا مختلفة لحساب المجاميع بكفاءة في جداول بيانات Pandas، شاملة الجمع الأساسي، والمجاميع التراكمية مع التجميع، والجمع الشرطي.
جدول المحتويات:
- الجمع الأساسي لأعمدة جدول بيانات Pandas
- المجموع التراكمي مع
groupby()
- الجمع الشرطي بناءً على قيم أعمدة أخرى
1. الجمع الأساسي لأعمدة جدول بيانات Pandas
أبسط طريقة لجمع عمود في جدول بيانات Pandas هي استخدام طريقة .sum()
. يحسب هذا مباشرة مجموع جميع القيم في العمود المحدد. يتم تجاهل القيم غير العددية.
import pandas as pd
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# مجموع العمود 'A'
sum_A = df['A'].sum()
print(f"مجموع العمود A: {sum_A}") # المخرجات: مجموع العمود A: 15
# مجموع العمود 'B'
sum_B = df['B'].sum()
print(f"مجموع العمود B: {sum_B}") # المخرجات: مجموع العمود B: 40
# مجموع جميع الأعمدة العددية
sum_all = df.sum()
print(f"مجموع جميع الأعمدة العددية:n{sum_all}")
2. المجموع التراكمي مع groupby()
يُشترط لحساب المجاميع التراكمية ضمن المجموعات استخدام طريقة groupby()
مع .cumsum()
. يسمح هذا بالجمع الفعال عبر فئات مختلفة.
import pandas as pd
data = {'Group': ['X', 'X', 'Y', 'Y', 'Y'],
'Value': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# تجميع حسب 'Group' وحساب المجموع التراكمي لـ 'Value'
cumulative_sum = df.groupby('Group')['Value'].cumsum()
df['Cumulative Sum'] = cumulative_sum
print(df)
سوف يُخرج هذا جدول بيانات بعمود “المجموع التراكمي” يُظهر المجموع التراكمي لكل مجموعة.
3. الجمع الشرطي بناءً على قيم أعمدة أخرى
يسمح الجمع الشرطي بجمع القيم بناءً على شروط تُطبق على أعمدة أخرى. يُحقق هذا الفهرسة المنطقية وطريقة .sum()
.
import pandas as pd
data = {'Category': ['A', 'B', 'A', 'B', 'A'],
'Sales': [100, 150, 200, 250, 300]}
df = pd.DataFrame(data)
# مجموع 'Sales' حيث 'Category' هو 'A'
sum_A = df[df['Category'] == 'A']['Sales'].sum()
print(f"مجموع المبيعات للفئة A: {sum_A}") # المخرجات: مجموع المبيعات للفئة A: 600
# مجموع 'Sales' حيث 'Sales' أكبر من 200
sum_greater_200 = df[df['Sales'] > 200]['Sales'].sum()
print(f"مجموع المبيعات أكبر من 200: {sum_greater_200}") # المخرجات: مجموع المبيعات أكبر من 200: 550
يُوضح هذا تصفية جدول البيانات قبل الجمع للحصول على عمليات تجميع شرطية فعالة. تذكر تكييف هذه التقنيات مع بياناتك ومتطلباتك المحددة. توفر Pandas العديد من الأدوات لتحليل البيانات بكفاءة.