Pandas डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली Python लाइब्रेरी है, और कॉलम मानों के योग की गणना एक अक्सर उपयोग किया जाने वाला कार्य है। यह लेख Pandas DataFrames में डेटा के कुशलतापूर्वक योग करने के विभिन्न तरीकों का पता लगाता है, जिसमें बुनियादी योग, समूहीकरण के साथ संचयी योग और सशर्त योग शामिल हैं।
विषयसूची:
- Pandas DataFrame कॉलम का बुनियादी योग
groupby()
के साथ संचयी योग- अन्य कॉलम मानों के आधार पर सशर्त योग
1. Pandas DataFrame कॉलम का बुनियादी योग
Pandas DataFrame कॉलम का योग करने का सबसे सरल तरीका .sum()
विधि का उपयोग करना है। यह सीधे निर्दिष्ट कॉलम में सभी मानों का योग की गणना करता है। गैर-संख्यात्मक मानों को अनदेखा किया जाता है।
import pandas as pd
data = {'A': [1, 2, 3, 4, 5],
'B': [6, 7, 8, 9, 10],
'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)
# कॉलम 'A' का योग
sum_A = df['A'].sum()
print(f"कॉलम A का योग: {sum_A}") # आउटपुट: कॉलम A का योग: 15
# कॉलम 'B' का योग
sum_B = df['B'].sum()
print(f"कॉलम B का योग: {sum_B}") # आउटपुट: कॉलम B का योग: 40
# सभी संख्यात्मक कॉलम का योग
sum_all = df.sum()
print(f"सभी संख्यात्मक कॉलम का योग:n{sum_all}")
2. groupby()
के साथ संचयी योग
समूहों के भीतर संचयी योग की गणना करने के लिए groupby()
विधि को .cumsum()
के साथ जोड़ने की आवश्यकता होती है। यह विभिन्न श्रेणियों में कुशल एकत्रीकरण की अनुमति देता है।
import pandas as pd
data = {'Group': ['X', 'X', 'Y', 'Y', 'Y'],
'Value': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)
# 'Group' द्वारा समूह बनाएँ और 'Value' का संचयी योग गणना करें
cumulative_sum = df.groupby('Group')['Value'].cumsum()
df['Cumulative Sum'] = cumulative_sum
print(df)
यह एक DataFrame आउटपुट करेगा जिसमें ‘संचयी योग’ कॉलम प्रत्येक समूह के लिए संचयी योग दिखाता है।
3. अन्य कॉलम मानों के आधार पर सशर्त योग
सशर्त योग आपको अन्य कॉलम पर लागू शर्तों के आधार पर मानों का योग करने की अनुमति देता है। बूलियन इंडेक्सिंग और .sum()
विधि इसे प्राप्त करते हैं।
import pandas as pd
data = {'Category': ['A', 'B', 'A', 'B', 'A'],
'Sales': [100, 150, 200, 250, 300]}
df = pd.DataFrame(data)
# 'Sales' का योग जहाँ 'Category' 'A' है
sum_A = df[df['Category'] == 'A']['Sales'].sum()
print(f"Category A के लिए Sales का योग: {sum_A}") # आउटपुट: Category A के लिए Sales का योग: 600
# 'Sales' का योग जहाँ 'Sales' 200 से अधिक है
sum_greater_200 = df[df['Sales'] > 200]['Sales'].sum()
print(f"200 से अधिक Sales का योग: {sum_greater_200}") # आउटपुट: 200 से अधिक Sales का योग: 550
यह शक्तिशाली सशर्त समुच्चय के लिए योग से पहले DataFrame को फ़िल्टर करने का प्रदर्शन करता है। अपनी विशिष्ट डेटा और आवश्यकताओं के लिए इन तकनीकों को अनुकूलित करना याद रखें। Pandas कुशल डेटा विश्लेषण के लिए कई उपकरण प्रदान करता है।