Data Wrangling

पांडा डेटाफ्रेम कॉलम को स्ट्रिंग में कुशलतापूर्वक बदलना

Spread the love

Pandas डेटा हेरफेर और विश्लेषण के लिए एक शक्तिशाली Python लाइब्रेरी है। DataFrame कॉलम को स्ट्रिंग में बदलना एक सामान्य कार्य है, जो अक्सर स्ट्रिंग स्वरूपण, संयोजन या अन्य लाइब्रेरी के साथ संगतता के लिए आवश्यक होता है। यह लेख इस रूपांतरण के लिए दो कुशल विधियों का विवरण देता है: astype(str) विधि और apply विधि का उपयोग करना।

विषयवस्तु की तालिका

astype(str) के साथ कुशल स्ट्रिंग रूपांतरण

astype(str) विधि Pandas सीरीज़ (कॉलम) को स्ट्रिंग में बदलने का सबसे सरल और सबसे कुशल तरीका प्रदान करती है। यह सीधे संपूर्ण सीरीज़ के डेटा प्रकार को बदल देता है, जिससे यह समरूप डेटा के लिए आदर्श हो जाता है। हालाँकि, यदि कॉलम में ऐसे मान हैं जिन्हें सीधे स्ट्रिंग में परिवर्तित नहीं किया जा सकता है (जैसे, मिश्रित डेटा प्रकार), तो यह एक त्रुटि उत्पन्न करेगा।


import pandas as pd

# नमूना DataFrame
data = {'col1': [1, 2, 3], 'col2': [4.5, 5.6, 6.7], 'col3': ['a', 'b', 'c']}
df = pd.DataFrame(data)

# 'col1' को स्ट्रिंग में बदलें
df['col1'] = df['col1'].astype(str)

# DataFrame प्रिंट करें
print(df)

यह कोड ‘col1’ में पूर्णांक मानों को उनके स्ट्रिंग निरूपण में बदल देता है। बड़े डेटासेट के साथ काम करते समय विधि की संक्षिप्तता और प्रदर्शन विशेष रूप से फायदेमंद होते हैं।

apply विधि के साथ लचीला स्ट्रिंग रूपांतरण

apply विधि अधिक लचीलापन प्रदान करती है, खासकर जब विषम डेटा को संभालने या कस्टम रूपांतरण तर्क की आवश्यकता होती है। यह प्रत्येक तत्व पर व्यक्तिगत रूप से एक फ़ंक्शन लागू करता है, जिससे त्रुटि हैंडलिंग और जटिल परिवर्तन की अनुमति मिलती है।


import pandas as pd

# मिश्रित डेटा प्रकार के साथ नमूना DataFrame
data = {'col1': [1, 2, 3, 'a', [1,2]], 'col2': [4.5, 5.6, 6.7, 'b']}
df = pd.DataFrame(data)

# स्ट्रिंग में बदलने के लिए फ़ंक्शन, संभावित त्रुटियों को संभालना
def convert_to_string(x):
    try:
        return str(x)
    except:
        return "NA"

# apply का उपयोग करके 'col1' को बदलें
df['col1'] = df['col1'].apply(convert_to_string)

# DataFrame प्रिंट करें
print(df)

यहाँ, convert_to_string फ़ंक्शन संभावित रूपांतरण त्रुटियों को संभालता है। यदि किसी तत्व को परिवर्तित नहीं किया जा सकता है (जैसे सूची), तो यह “NA” देता है। apply विधि तब इस फ़ंक्शन को तत्व-वार लागू करती है, जिससे मिश्रित डेटा प्रकार के साथ भी एक स्ट्रिंग कॉलम सुनिश्चित होता है। जबकि अधिक मज़बूत, यह दृष्टिकोण बहुत बड़े DataFrames के लिए astype(str) की तुलना में कम प्रदर्शनकारी हो सकता है।

सर्वोत्तम दृष्टिकोण चुनना

समरूप डेटा के सीधे रूपांतरण के लिए, इसकी दक्षता के कारण astype(str) अनुशंसित विधि है। विषम डेटा, त्रुटि हैंडलिंग, या कस्टम परिवर्तनों के साथ जटिल परिदृश्यों के लिए, apply विधि आवश्यक लचीलापन प्रदान करती है। इष्टतम विकल्प आपके डेटा और रूपांतरण आवश्यकताओं की जटिलता के बीच प्रदर्शन और समझौते पर निर्भर करता है।

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *