Data Analysis

Pandas DataFrame’lerine Etkin Satır Ekleme

Spread the love

Pandas DataFrame’leri, Python’da veri manipülasyonunun temel taşlarından biridir. Verimli bir şekilde satır eklemek yaygın bir görevdir ve bu makale, DataFrame’inize tek bir satır eklemek için en iyi uygulamaları detaylandırmaktadır.

İçerik Tablosu

Verimli Satır Ekleme İçin .loc Kullanımı

.loc erişimcisi, bir satır eklemenin en verimli ve doğrudan yolunu sağlar. Özellikle daha büyük DataFrame’lerle çalışırken, performans yükünü en aza indirerek avantajlıdır. Yeni satır için indeksi belirtirsiniz ve veriyi liste veya NumPy dizisi olarak sağlarsınız.


import pandas as pd
import numpy as np

# Örnek DataFrame
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

# Liste olarak yeni satır verileri
new_row_list = [4, 7]

# .loc kullanarak yeni satırı ekleyin
df.loc[len(df)] = new_row_list

print("Liste Kullanarak:n", df)


# NumPy dizisi olarak yeni satır verileri
new_row_array = np.array([5,8])

# NumPy dizisiyle .loc kullanarak yeni satırı ekleyin
df.loc[len(df)] = new_row_array

print("nNumPy Dizisi Kullanarak:n",df)

Bu yaklaşım, DataFrame’in altta yatan yapısını doğrudan değiştirir, bu da onu alternatiflerden daha hızlı hale getirir. Çıktı, eklenen yeni satırları gösterir.

Okunabilirlik İçin Sözlüklerle Ekleme

Birçok sütunla uğraşırken, yeni satırı temsil etmek için bir sözlük kullanmak kod okunabilirliğini artırır. Sözlük anahtarları sütun adlarına karşılık gelir ve değerler satırın verileridir. pd.concat, mevcut DataFrame’i yeni satırla verimli bir şekilde birleştirir.


import pandas as pd

# Örnek DataFrame
data = {'col1': [1, 2, 3], 'col2': [4, 5, 6]}
df = pd.DataFrame(data)

# Sözlük olarak yeni satır verileri
new_row_dict = {'col1': 5, 'col2': 8}

# pd.concat kullanarak yeni satırı ekleyin
df = pd.concat([df, pd.DataFrame([new_row_dict])], ignore_index=True)

print(df)

ignore_index=True, yinelenen indeksleri önleyerek doğru indeks işlemeyi sağlar.

append() Yönteminden Neden Kaçınmalısınız?

append() yöntemi, modern Pandas sürümlerinde kullanılmıyor. Daha az verimlidir ve beklenmedik davranışlara yol açabilir. .loc ve sözlük tabanlı yöntemler, performans ve sürdürülebilirlik açısından üstündür. Her zaman yukarıda açıklanan daha verimli ve desteklenen yaklaşımları tercih edin.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir