पांडा डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली पायथन लाइब्रेरी है। आपके DataFrame में नए कॉलम जोड़ना एक सामान्य कार्य है, और कभी-कभी आपको उन कॉलम को खाली शुरू करने की आवश्यकता होती है। यह लेख पांडा DataFrame में खाली कॉलम बनाने के कई कुशल तरीकों का पता लगाता है, उनकी ताकत और कब उपयोग करना है, इस पर प्रकाश डालता है।
विषयवस्तु की तालिका:
- सरल असाइनमेंट के साथ खाली कॉलम बनाना
pandas.DataFrame.reindex()
का उपयोग करनाpandas.DataFrame.assign()
का उपयोग करनाpandas.DataFrame.insert()
का उपयोग करना
सरल असाइनमेंट के साथ खाली कॉलम बनाना
सबसे सरल तरीका NaN
(नंबर नहीं) मानों से भरे सूची या NumPy ऐरे का उपयोग करके प्रत्यक्ष असाइनमेंट है। यह छोटे DataFrame के लिए कुशल है और बहुत सहज है।
import pandas as pd
import numpy as np
# नमूना DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# एक खाली कॉलम जोड़ें
df['Empty'] = np.nan # या [np.nan] * len(df)
print(df)
pandas.DataFrame.reindex()
का उपयोग करना
reindex()
विधि लचीलापन प्रदान करती है, जिससे आप एक साथ कई कॉलम जोड़ सकते हैं और उनके डेटा प्रकार निर्दिष्ट कर सकते हैं। यह कई खाली कॉलम एक साथ जोड़ते समय विशेष रूप से उपयोगी है।
import pandas as pd
# नमूना DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# कई खाली कॉलम जोड़ें
df = df.reindex(columns=['A', 'B', 'Empty1', 'Empty2'])
print(df)
pandas.DataFrame.assign()
का उपयोग करना
assign()
विधि नए कॉलम जोड़ने का एक संक्षिप्त तरीका प्रदान करती है, विशेष रूप से कई DataFrame संचालन को जोड़ते समय उपयोगी है। यह एक *नया* DataFrame लौटाता है, मूल को तब तक अपरिवर्तित छोड़ देता है जब तक कि स्पष्ट रूप से पुनः असाइन नहीं किया जाता है।
import pandas as pd
import numpy as np
# नमूना DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# असाइन का उपयोग करके एक खाली कॉलम जोड़ें
df = df.assign(Empty=np.nan)
print(df)
pandas.DataFrame.insert()
का उपयोग करना
insert()
विधि कॉलम प्लेसमेंट पर सटीक नियंत्रण प्रदान करती है, जिससे आप किसी विशिष्ट इंडेक्स पर एक कॉलम जोड़ सकते हैं। यह तब फायदेमंद होता है जब किसी विशेष कॉलम क्रम को बनाए रखना महत्वपूर्ण होता है।
import pandas as pd
import numpy as np
# नमूना DataFrame
data = {'A': [1, 2, 3], 'B': [4, 5, 6]}
df = pd.DataFrame(data)
# इंडेक्स 1 (दूसरी स्थिति) पर एक खाली कॉलम जोड़ें
df.insert(1, 'Empty', np.nan)
print(df)
संक्षेप में, प्रत्येक विधि एक अनूठा लाभ प्रदान करती है। अपनी आवश्यकताओं और कोडिंग शैली के अनुसार सबसे उपयुक्त विधि चुनें, कॉलम की संख्या, वांछित स्थिति और समग्र कोड संरचना जैसे कारकों पर विचार करें। याद रखें कि सभी विधियों के परिणामस्वरूप NaN
मानों से भरे कॉलम होते हैं, जिन्हें पांडा आगे के विश्लेषण में सहज रूप से संभालता है।