पांडा DataFrame कॉलम हेडर निकालना और उनका हेरफेर करना
पायथन डेटा साइंस इकोसिस्टम में एक आधारशिला लाइब्रेरी, पांडा, DataFrame कॉलम हेडर के साथ सहज तरीके से इंटरैक्ट करने के तरीके प्रदान करता है। यह गाइड एकल-स्तरीय और बहु-स्तरीय कॉलम संरचनाओं दोनों के लिए उपयुक्त, इन हेडर को निकालने और उनका हेरफेर करने के विभिन्न तकनीकों का विवरण देता है।
विषयसूची
- एकल-स्तरीय हेडर तक पहुँचना
- बहु-सूचकांक स्तंभों को संभालना
- व्यावहारिक अनुप्रयोग
- त्रुटि संचालन और मजबूती
- उन्नत तकनीकें (अनुभवी उपयोगकर्ताओं के लिए)
एकल-स्तरीय हेडर तक पहुँचना
एकल स्तर के कॉलम हेडर वाले DataFrames के लिए, उन तक पहुँचना सरल है। .columns
विशेषता एक पांडा इंडेक्स ऑब्जेक्ट देता है, जो एक लेबल वाले सरणी की तरह काम करता है। इसे बिल्ट-इन list()
फ़ंक्शन का उपयोग करके सीधे सूची में बदलना सरल है।
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 28],
'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)
# पांडा इंडेक्स के रूप में हेडर तक पहुँच
headers_index = df.columns
# पायथन सूची में बदलें
headers_list = list(df.columns)
print("इंडेक्स के रूप में हेडर:", headers_index)
print("सूची के रूप में हेडर:", headers_list)
बहु-सूचकांक स्तंभों को संभालना
बहु-सूचकांक स्तंभों (क्रमसूचक स्तंभ संगठन) वाले DataFrames से निपटते समय, हेडर प्राप्त करने के लिए अधिक सूक्ष्म दृष्टिकोण की आवश्यकता होती है। .columns
विशेषता अभी भी एक पांडा इंडेक्स देता है, लेकिन यह इंडेक्स अब बहु-स्तरीय है। सूची प्रतिनिधित्व में प्रत्येक तत्व एक टुपल बन जाता है जो पदानुक्रमित स्तरों को दर्शाता है।
# बहु-सूचकांक स्तंभों के साथ नमूना DataFrame
data2 = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 28],
'City': ['New York', 'London', 'Paris']}
df2 = pd.DataFrame(data2)
df2 = df2.set_index(['Name', 'Age']) #बहु-सूचकांक बनाना
multiindex_headers = df2.columns
multiindex_list = list(multiindex_headers)
print("सूची के रूप में बहु-सूचकांक हेडर:", multiindex_list)
# व्यक्तिगत स्तरों तक पहुँचना
level_0 = [col[0] for col in multiindex_list] # पहले स्तर तक पहुँचना
print("स्तर 0:", level_0)
# बहु-सूचकांक सूची को समतल करना
import itertools
flattened_list = list(itertools.chain(*multiindex_list))
print("समतल सूची:", flattened_list)
व्यावहारिक अनुप्रयोग
कॉलम हेडर निकालने से कई डेटा हेरफेर कार्यों में उपयोगिता मिलती है, जिसमें शामिल हैं:
- गतिशील रूप से रिपोर्ट शीर्षक या लेबल उत्पन्न करना।
- लेबल वाले अक्षों के साथ कस्टम डेटा विज़ुअलाइज़ेशन बनाना।
- हेडर नामों के आधार पर चयनात्मक कॉलम संचालन करना।
- हेडर जानकारी के आधार पर डेटा सफाई या पूर्व-संसाधन की सुविधा प्रदान करना।
त्रुटि संचालन और मजबूती
हमेशा उन परिदृश्यों पर विचार करें जहाँ आपका DataFrame खाली हो सकता है या अप्रत्याशित कॉलम संरचनाएँ हो सकती हैं। इन स्थितियों के लिए जाँच जोड़ने से आपके कोड की मजबूती बढ़ जाती है:
if not df.empty:
headers = list(df.columns)
# 'headers' का उपयोग करके आगे की प्रक्रिया के साथ आगे बढ़ें
else:
print("DataFrame खाली है!")
उन्नत तकनीकें (अनुभवी उपयोगकर्ताओं के लिए)
अधिक जटिल कॉलम संरचनाओं या अनुकूलित हेडर हेरफेर के लिए, उन्नत पांडा कार्यात्मकताओं का उपयोग करने पर विचार करें जैसे:
df.columns.tolist()
: सूची में बदलने के लिए एक अधिक संक्षिप्त विधि।df.columns.map(lambda x: x.lower())
: हेडर नामों को संशोधित करने के लिए स्ट्रिंग संचालन लागू करना।df.rename(columns={'old_name': 'new_name'})
: व्यवस्थित रूप से कॉलम नाम बदलना।