पांडा डेटाफ्रेम पायथन में डेटा मैनिपुलेशन के लिए आवश्यक हैं। कॉलम हेडर (जिन्हें कॉलम नाम भी कहा जाता है) का प्रबंधन एक लगातार कार्य है। यह लेख डेटाफ्रेम हेडर के साथ काम करने के विभिन्न तकनीकों का पता लगाता है, जिसमें डेटाफ्रेम बनाने से लेकर CSV फ़ाइलों से डेटा आयात करने के परिदृश्य शामिल हैं।
विषयसूची
हेडर के साथ डेटाफ्रेम बनाना
हेडर जोड़ने का सबसे सरल तरीका डेटाफ्रेम निर्माण के दौरान है। यह आदर्श है जब आप सूचियों या सरणियों से डेटाफ्रेम बना रहे होते हैं।
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
columns = ['A', 'B', 'C']
df = pd.DataFrame(data, columns=columns)
print(df)
यह सीधे कॉलम नाम असाइन करता है। columns
आर्ग्यूमेंट को छोड़ देने पर डिफ़ॉल्ट संख्यात्मक इंडेक्स (0, 1, 2…) कॉलम नाम के रूप में आते हैं।
मौजूदा हेडर को संशोधित करना
हेडर की कमी वाले या हेडर अपडेट की आवश्यकता वाले डेटाफ्रेम के लिए, columns
एट्रिब्यूट को संशोधित करें:
import pandas as pd
data = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
df = pd.DataFrame(data) # हेडर के बिना डेटाफ्रेम
df.columns = ['X', 'Y', 'Z']
print(df)
यह मौजूदा कॉलम नामों को पूरी तरह से बदल देता है। ध्यान दें कि यह विधि अधिलेखित करती है; यह मौजूदा हेडर में संलग्न नहीं होती है।
CSV आयात को संभालना
read_csv()
फ़ंक्शन हेडर हैंडलिंग पर नियंत्रण प्रदान करता है:
import pandas as pd
# data.csv:
# 1,2,3
# 4,5,6
# 7,8,9
# CSV फ़ाइल में कोई हेडर पंक्ति नहीं:
df = pd.read_csv('data.csv', header=None, names=['A', 'B', 'C'])
print(df)
# पहली पंक्ति में हेडर है:
df2 = pd.read_csv('data.csv', header=0)
print(df2)
header=None
का अर्थ है कोई हेडर पंक्ति नहीं; names
कस्टम कॉलम नाम असाइन करता है। header=0
इंगित करता है कि पहली पंक्ति हेडर है।
ये तकनीकें विभिन्न डेटा संरचनाओं और आयात विधियों के अनुकूल होने पर, डेटाफ्रेम हेडर के प्रबंधन में लचीलापन प्रदान करती हैं। अपने डेटा और कार्य के लिए सबसे उपयुक्त विधि चुनें।