Data Science

पांडा डेटाफ्रेम में महारथ: कुशल शीर्षक प्रबंधन

Spread the love

पांडा डेटाफ्रेम पायथन में डेटा मैनिपुलेशन के लिए आवश्यक हैं। कॉलम हेडर (जिन्हें कॉलम नाम भी कहा जाता है) का प्रबंधन एक लगातार कार्य है। यह लेख डेटाफ्रेम हेडर के साथ काम करने के विभिन्न तकनीकों का पता लगाता है, जिसमें डेटाफ्रेम बनाने से लेकर CSV फ़ाइलों से डेटा आयात करने के परिदृश्य शामिल हैं।

विषयसूची

हेडर के साथ डेटाफ्रेम बनाना

हेडर जोड़ने का सबसे सरल तरीका डेटाफ्रेम निर्माण के दौरान है। यह आदर्श है जब आप सूचियों या सरणियों से डेटाफ्रेम बना रहे होते हैं।


import pandas as pd

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)

यह सीधे कॉलम नाम असाइन करता है। columns आर्ग्यूमेंट को छोड़ देने पर डिफ़ॉल्ट संख्यात्मक इंडेक्स (0, 1, 2…) कॉलम नाम के रूप में आते हैं।

मौजूदा हेडर को संशोधित करना

हेडर की कमी वाले या हेडर अपडेट की आवश्यकता वाले डेटाफ्रेम के लिए, columns एट्रिब्यूट को संशोधित करें:


import pandas as pd

data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data)  # हेडर के बिना डेटाफ्रेम
df.columns = ['X', 'Y', 'Z']
print(df)

यह मौजूदा कॉलम नामों को पूरी तरह से बदल देता है। ध्यान दें कि यह विधि अधिलेखित करती है; यह मौजूदा हेडर में संलग्न नहीं होती है।

CSV आयात को संभालना

read_csv() फ़ंक्शन हेडर हैंडलिंग पर नियंत्रण प्रदान करता है:


import pandas as pd

# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9

# CSV फ़ाइल में कोई हेडर पंक्ति नहीं:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)

# पहली पंक्ति में हेडर है:
df2 = pd.read_csv('data.csv', header=0) 
print(df2)

header=None का अर्थ है कोई हेडर पंक्ति नहीं; names कस्टम कॉलम नाम असाइन करता है। header=0 इंगित करता है कि पहली पंक्ति हेडर है।

ये तकनीकें विभिन्न डेटा संरचनाओं और आयात विधियों के अनुकूल होने पर, डेटाफ्रेम हेडर के प्रबंधन में लचीलापन प्रदान करती हैं। अपने डेटा और कार्य के लिए सबसे उपयुक्त विधि चुनें।

प्रातिक्रिया दे

आपका ईमेल पता प्रकाशित नहीं किया जाएगा. आवश्यक फ़ील्ड चिह्नित हैं *