Data Science

Listelerden Pandas DataFrame’leri Verimli Şekilde Oluşturmak

Spread the love

Pandas, veri manipülasyonu ve analizi için güçlü bir Python kütüphanesidir. Temelini, çok yönlü iki boyutlu etiketlenmiş veri yapısı olan DataFrame oluşturur. Sık sık, mevcut verilerden DataFrame’ler oluşturmanız gerekir ve listeler yaygın ve kullanışlı bir başlangıç noktası sağlar. Bu makale, çeşitli liste yapılarından Pandas DataFrame’leri oluşturmak için birkaç verimli yöntemi ele almaktadır.

İçerik Tablosu

Yöntem 1: Basit Bir Listeden

En basit yaklaşım, bir DataFrame oluşturmak için tek bir liste kullanır. Bu, tek bir sütunu temsil eden veriler için idealdir.


import pandas as pd

data = [10, 20, 30, 40, 50]
df = pd.DataFrame(data, columns=['Değerler'])
print(df)

Bu, data listesinden gelen öğelerle doldurulmuş ‘Değerler’ adlı tek bir sütuna sahip bir DataFrame oluşturur.

Yöntem 2: Listelerden Oluşan Bir Listeden

Çok sütunlu DataFrame’ler için, listelerden oluşan bir liste daha çok yönlüdür. Her iç liste bir satırı temsil eder.


import pandas as pd

data = [[1, 'Alice', 25], [2, 'Bob', 30], [3, 'Charlie', 28]]
df = pd.DataFrame(data, columns=['ID', 'Ad', 'Yaş'])
print(df)

Dış liste satırları tutar ve columns sütun adlarını belirtir. Her iç listenin, sütun sayısıyla aynı uzunlukta olduğundan emin olun.

Yöntem 3: Sözlüklerden Oluşan Bir Listeden

Bu yöntem, özellikle adlandırılmış sütunlar söz konusu olduğunda, daha iyi okunabilirlik ve esneklik sunar. Her sözlük, anahtarları sütun adları olan bir satırı temsil eder.


import pandas as pd

data = [{'ID': 1, 'Ad': 'Alice', 'Yaş': 25},
        {'ID': 2, 'Ad': 'Bob', 'Yaş': 30},
        {'ID': 3, 'Ad': 'Charlie', 'Yaş': 28}]
df = pd.DataFrame(data)
print(df)

Sütun adları, sözlük anahtarlarından otomatik olarak çıkarılır. Bu, özellikle büyük veri kümeleriyle birlikte, genellikle netlik için tercih edilir.

Yöntem 4: NumPy Dizilerini Kullanma

Sayısal veriler için NumPy dizileri performans avantajları sunar.


import pandas as pd
import numpy as np

data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
df = pd.DataFrame(data, columns=['A', 'B', 'C'])
print(df)

NumPy’nin verimli depolaması, özellikle kapsamlı sayısal verilerle DataFrame oluşturma hızını artırır.

Sonuç

Pandas DataFrame’lerini listelerden oluşturmak, esnek ve verimli bir iş akışı sağlar. En iyi yaklaşım, veri yapınıza ve performans ihtiyaçlarınıza bağlıdır. Sözlüklerden oluşan listeler genellikle okunabilirlik ve kullanım kolaylığı arasında en iyi dengeyi sağlar; NumPy dizileri ise büyük sayısal veri kümeleriyle performans optimizasyonu için idealdir.

SSS

  • S: İç listelerin uzunlukları farklıysa ne olur? C: Pandas bir ValueError hatası verecektir. Tüm iç listelerde tutarlı uzunlukları koruyun.
  • S: Tek satırlı bir DataFrame oluşturabilir miyim? C: Evet, tek bir liste, tek iç listeli bir liste veya tek sözlük içeren bir liste ile herhangi bir yöntemi kullanın.
  • S: Pandas karma veri tiplerini nasıl işler? C: Pandas her sütun için en uygun veri tipini belirler.
  • S: Eksik verileri nasıl temsil ederim? C: Eksik değerleri temsil etmek için np.nan (Sayı Değil) kullanın.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir