Data Analysis with Pandas

पांडा में महारथ: DataFrame कॉलमों का कुशल योग

Spread the love

Pandas डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली Python लाइब्रेरी है, और कॉलम मानों के योग की गणना एक अक्सर उपयोग किया जाने वाला कार्य है। यह लेख Pandas DataFrames में डेटा के कुशलतापूर्वक योग करने के विभिन्न तरीकों का पता लगाता है, जिसमें बुनियादी योग, समूहीकरण के साथ संचयी योग और सशर्त योग शामिल हैं।

विषयसूची:

  1. Pandas DataFrame कॉलम का बुनियादी योग
  2. groupby() के साथ संचयी योग
  3. अन्य कॉलम मानों के आधार पर सशर्त योग

1. Pandas DataFrame कॉलम का बुनियादी योग

Pandas DataFrame कॉलम का योग करने का सबसे सरल तरीका .sum() विधि का उपयोग करना है। यह सीधे निर्दिष्ट कॉलम में सभी मानों का योग की गणना करता है। गैर-संख्यात्मक मानों को अनदेखा किया जाता है।


import pandas as pd

data = {'A': [1, 2, 3, 4, 5],
        'B': [6, 7, 8, 9, 10],
        'C': [11, 12, 13, 14, 15]}
df = pd.DataFrame(data)

# कॉलम 'A' का योग
sum_A = df['A'].sum()
print(f"कॉलम A का योग: {sum_A}")  # आउटपुट: कॉलम A का योग: 15

# कॉलम 'B' का योग
sum_B = df['B'].sum()
print(f"कॉलम B का योग: {sum_B}")  # आउटपुट: कॉलम B का योग: 40

# सभी संख्यात्मक कॉलम का योग
sum_all = df.sum()
print(f"सभी संख्यात्मक कॉलम का योग:n{sum_all}")

2. groupby() के साथ संचयी योग

समूहों के भीतर संचयी योग की गणना करने के लिए groupby() विधि को .cumsum() के साथ जोड़ने की आवश्यकता होती है। यह विभिन्न श्रेणियों में कुशल एकत्रीकरण की अनुमति देता है।


import pandas as pd

data = {'Group': ['X', 'X', 'Y', 'Y', 'Y'],
        'Value': [10, 20, 30, 40, 50]}
df = pd.DataFrame(data)

# 'Group' द्वारा समूह बनाएँ और 'Value' का संचयी योग गणना करें
cumulative_sum = df.groupby('Group')['Value'].cumsum()
df['Cumulative Sum'] = cumulative_sum
print(df)

यह एक DataFrame आउटपुट करेगा जिसमें ‘संचयी योग’ कॉलम प्रत्येक समूह के लिए संचयी योग दिखाता है।

3. अन्य कॉलम मानों के आधार पर सशर्त योग

सशर्त योग आपको अन्य कॉलम पर लागू शर्तों के आधार पर मानों का योग करने की अनुमति देता है। बूलियन इंडेक्सिंग और .sum() विधि इसे प्राप्त करते हैं।


import pandas as pd

data = {'Category': ['A', 'B', 'A', 'B', 'A'],
        'Sales': [100, 150, 200, 250, 300]}
df = pd.DataFrame(data)

# 'Sales' का योग जहाँ 'Category' 'A' है
sum_A = df[df['Category'] == 'A']['Sales'].sum()
print(f"Category A के लिए Sales का योग: {sum_A}")  # आउटपुट: Category A के लिए Sales का योग: 600

# 'Sales' का योग जहाँ 'Sales' 200 से अधिक है
sum_greater_200 = df[df['Sales'] > 200]['Sales'].sum()
print(f"200 से अधिक Sales का योग: {sum_greater_200}") # आउटपुट: 200 से अधिक Sales का योग: 550

यह शक्तिशाली सशर्त समुच्चय के लिए योग से पहले DataFrame को फ़िल्टर करने का प्रदर्शन करता है। अपनी विशिष्ट डेटा और आवश्यकताओं के लिए इन तकनीकों को अनुकूलित करना याद रखें। Pandas कुशल डेटा विश्लेषण के लिए कई उपकरण प्रदान करता है।

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *