Data Analysis with Pandas

Pandas DataFrame में कॉलम औसत की कुशल गणना

Spread the love

Pandas डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली Python लाइब्रेरी है। Pandas DataFrame में किसी कॉलम का औसत (माध्य) ज्ञात करना एक अक्सर आवश्यक कार्य है। यह लेख इसे पूरा करने के दो कुशल तरीकों का प्रदर्शन करता है: df.mean() विधि और df.describe() विधि का उपयोग करना।

विषयसूची:

df.mean() के साथ माध्य की गणना करना

df.mean() विधि आपके DataFrame में सभी संख्यात्मक कॉलम के औसत की गणना करने का एक सीधा तरीका प्रदान करती है। किसी विशिष्ट कॉलम का औसत प्राप्त करने के लिए, बस कोष्ठक या डॉट नोटेशन का उपयोग करके कॉलम का चयन करें और फिर mean() विधि लागू करें।

यहाँ एक उदाहरण दिया गया है:


import pandas as pd

# नमूना DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 22, 28],
        'Score': [85, 92, 78, 88]}
df = pd.DataFrame(data)

# कोष्ठक संकेतन का उपयोग करके औसत आयु
average_age = df['Age'].mean()
print(f"औसत आयु: {average_age}")

# डॉट नोटेशन का उपयोग करके औसत स्कोर
average_score = df.Score.mean()
print(f"औसत स्कोर: {average_score}")

यह उत्पन्न करेगा:


औसत आयु: 26.25
औसत स्कोर: 85.75

महत्वपूर्ण रूप से, df.mean() गणना से उन्हें बाहर करके लापता मानों (NaN) को समझदारी से संभालता है। हालाँकि, यदि आपके कॉलम में गैर-संख्यात्मक डेटा है, तो आपको एक TypeError का सामना करना पड़ेगा। इस विधि का उपयोग करने से पहले हमेशा सुनिश्चित करें कि आपके कॉलम में केवल संख्यात्मक मान हैं।

df.describe() के साथ वर्णनात्मक सांख्यिकी का अन्वेषण करना

df.describe() विधि आपके DataFrame के वर्णनात्मक सांख्यिकी का एक व्यापक सारांश उत्पन्न करती है। इसमें प्रत्येक संख्यात्मक कॉलम के लिए माध्य, गणना, मानक विचलन, न्यूनतम, अधिकतम और चतुर्थक शामिल हैं। केवल औसत से अधिक प्रदान करने के अलावा, यह अन्य मूल्यवान सांख्यिकीय मापों के साथ माध्य प्राप्त करने का एक आसान तरीका है।

उसी DataFrame का उपयोग करना:


import pandas as pd

# नमूना DataFrame (पहले जैसा ही)
data = {'Name': ['Alice', 'Bob', 'Charlie', 'David'],
        'Age': [25, 30, 22, 28],
        'Score': [85, 92, 78, 88]}
df = pd.DataFrame(data)

# वर्णनात्मक सांख्यिकी
summary_stats = df.describe()
print(summary_stats)

यह इस तरह की तालिका आउटपुट करेगा:


         Age    Score
count   4.0   4.0000
mean   26.25  85.7500
std     3.50   6.2361
min    22.00  78.0000
25%    23.75  81.2500
50%    26.50  86.5000
75%    29.25  90.2500
max    30.00  92.0000

‘आयु’ और ‘स्कोर’ के लिए माध्य स्पष्ट रूप से दिखाई दे रहे हैं। याद रखें कि df.describe() केवल संख्यात्मक कॉलम को संसाधित करता है।

संक्षेप में, df.mean() और df.describe() दोनों Pandas DataFrames में कॉलम औसत की गणना करने के प्रभावी तरीके प्रदान करते हैं। वह विधि चुनें जो आपकी आवश्यकताओं के सबसे उपयुक्त हो: केवल औसत के लिए df.mean(), या व्यापक सांख्यिकीय अवलोकन के लिए df.describe()। इन विधियों को लागू करने से पहले हमेशा संभावित डेटा प्रकार त्रुटियों को संभालें।

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *