Data Science

पांडा में महारथ: DataFrame में कॉलम जोड़ने के चार तरीके

Spread the love

पांडा डेटाफ्रेम पायथन में डेटा मैनिपुलेशन के लिए आवश्यक हैं। नए कॉलम जोड़ना एक सामान्य कार्य है, और पांडा इसे प्राप्त करने के कई कुशल तरीके प्रदान करता है। यह लेख चार प्रमुख विधियों का पता लगाता है, उनकी ताकत और कमजोरियों को उजागर करता है ताकि आप अपनी स्थिति के लिए सबसे अच्छा तरीका चुन सकें।

विषयवस्तु की तालिका

[] ऑपरेटर विधि: त्वरित और आसान तरीका

यह सबसे सरल विधि है, जो मौजूदा डेटा या सरल गणनाओं के आधार पर कॉलम जोड़ने के लिए आदर्श है। आप वर्ग कोष्ठक का उपयोग करके सीधे एक नए कॉलम में मान असाइन करते हैं।


import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)

df['City'] = ['New York', 'London', 'Paris']
print(df)

सीमाएँ: यह विधि किसी विशिष्ट स्थिति में सम्मिलित नहीं हो सकती है और नए कॉलम डेटा को डेटाफ्रेम की लंबाई से मेल खाने की आवश्यकता होती है।

df.insert() विधि: सटीक कॉलम प्लेसमेंट

df.insert() अधिक नियंत्रण प्रदान करता है, जिससे आप कॉलम के इंडेक्स (स्थिति) को निर्दिष्ट कर सकते हैं। यह तीन तर्क लेता है: स्थिति, कॉलम का नाम और डेटा।


import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)

df.insert(1, 'City', ['New York', 'London', 'Paris'])
print(df)

सर्वोत्तम: उन स्थितियों के लिए जहाँ कॉलम का क्रम महत्वपूर्ण है।

df.assign() विधि: एक साथ कई कॉलम जोड़ना

df.assign() एक साथ कई कॉलम जोड़ने या गणनाओं के आधार पर नए कॉलम बनाने के लिए विशेष रूप से उपयोगी है। महत्वपूर्ण रूप से, यह एक *नया* डेटाफ्रेम लौटाता है, मूल को अपरिवर्तित छोड़ देता है।


import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)

df = df.assign(City=['New York', 'London', 'Paris'], Age_Squared=df['Age']**2)
print(df)

सर्वोत्तम: कई कॉलम जोड़ने और परिकलित कॉलम के लिए; इसकी अपरिवर्तनीयता आकस्मिक डेटा हानि को रोकती है।

df.loc() विधि: सशर्त कॉलम निर्माण

df.loc() सबसे अधिक लचीलापन प्रदान करता है, जिससे पंक्ति चयन और बूलियन इंडेक्सिंग के आधार पर सशर्त कॉलम निर्माण की अनुमति मिलती है।


import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)

df.loc[df['Age'] < 30, 'Age_Group'] = 'Young'
df.loc[df['Age'] >= 30, 'Age_Group'] = 'Older'
print(df)

सर्वोत्तम: जटिल शर्तों के आधार पर कॉलम जोड़ने के लिए; बूलियन इंडेक्सिंग से परिचित होने की आवश्यकता है।

निष्कर्ष: इष्टतम विधि आपकी विशिष्ट आवश्यकताओं पर निर्भर करती है। [] ऑपरेटर सरल परिवर्धन के लिए त्वरित है, df.insert() कॉलम की स्थिति को नियंत्रित करता है, df.assign() कई या परिकलित कॉलम को कुशलतापूर्वक संभालता है, और df.loc() सशर्त कॉलम निर्माण को सक्षम बनाता है। वह विधि चुनें जो आपके कार्य के लिए पठनीयता और कार्यक्षमता को सर्वोत्तम संतुलित करती है।

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *