पांडा डेटाफ्रेम पायथन में डेटा मैनिपुलेशन के लिए आवश्यक हैं। नए कॉलम जोड़ना एक सामान्य कार्य है, और पांडा इसे प्राप्त करने के कई कुशल तरीके प्रदान करता है। यह लेख चार प्रमुख विधियों का पता लगाता है, उनकी ताकत और कमजोरियों को उजागर करता है ताकि आप अपनी स्थिति के लिए सबसे अच्छा तरीका चुन सकें।
विषयवस्तु की तालिका
[] ऑपरेटर विधि: त्वरित और आसान तरीका
यह सबसे सरल विधि है, जो मौजूदा डेटा या सरल गणनाओं के आधार पर कॉलम जोड़ने के लिए आदर्श है। आप वर्ग कोष्ठक का उपयोग करके सीधे एक नए कॉलम में मान असाइन करते हैं।
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)
df['City'] = ['New York', 'London', 'Paris']
print(df)
सीमाएँ: यह विधि किसी विशिष्ट स्थिति में सम्मिलित नहीं हो सकती है और नए कॉलम डेटा को डेटाफ्रेम की लंबाई से मेल खाने की आवश्यकता होती है।
df.insert()
विधि: सटीक कॉलम प्लेसमेंट
df.insert()
अधिक नियंत्रण प्रदान करता है, जिससे आप कॉलम के इंडेक्स (स्थिति) को निर्दिष्ट कर सकते हैं। यह तीन तर्क लेता है: स्थिति, कॉलम का नाम और डेटा।
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)
df.insert(1, 'City', ['New York', 'London', 'Paris'])
print(df)
सर्वोत्तम: उन स्थितियों के लिए जहाँ कॉलम का क्रम महत्वपूर्ण है।
df.assign()
विधि: एक साथ कई कॉलम जोड़ना
df.assign()
एक साथ कई कॉलम जोड़ने या गणनाओं के आधार पर नए कॉलम बनाने के लिए विशेष रूप से उपयोगी है। महत्वपूर्ण रूप से, यह एक *नया* डेटाफ्रेम लौटाता है, मूल को अपरिवर्तित छोड़ देता है।
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)
df = df.assign(City=['New York', 'London', 'Paris'], Age_Squared=df['Age']**2)
print(df)
सर्वोत्तम: कई कॉलम जोड़ने और परिकलित कॉलम के लिए; इसकी अपरिवर्तनीयता आकस्मिक डेटा हानि को रोकती है।
df.loc()
विधि: सशर्त कॉलम निर्माण
df.loc()
सबसे अधिक लचीलापन प्रदान करता है, जिससे पंक्ति चयन और बूलियन इंडेक्सिंग के आधार पर सशर्त कॉलम निर्माण की अनुमति मिलती है।
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 28]}
df = pd.DataFrame(data)
df.loc[df['Age'] < 30, 'Age_Group'] = 'Young'
df.loc[df['Age'] >= 30, 'Age_Group'] = 'Older'
print(df)
सर्वोत्तम: जटिल शर्तों के आधार पर कॉलम जोड़ने के लिए; बूलियन इंडेक्सिंग से परिचित होने की आवश्यकता है।
निष्कर्ष: इष्टतम विधि आपकी विशिष्ट आवश्यकताओं पर निर्भर करती है। [] ऑपरेटर सरल परिवर्धन के लिए त्वरित है, df.insert()
कॉलम की स्थिति को नियंत्रित करता है, df.assign()
कई या परिकलित कॉलम को कुशलतापूर्वक संभालता है, और df.loc()
सशर्त कॉलम निर्माण को सक्षम बनाता है। वह विधि चुनें जो आपके कार्य के लिए पठनीयता और कार्यक्षमता को सर्वोत्तम संतुलित करती है।