高效Python字典转Pandas DataFrame

15 6 月, 2025 - By admin

Spread the love

Pandas是一个强大的Python库，用于数据操作和分析。通常，您需要将存储在Python字典中的数据转换为Pandas DataFrame以便于分析。本文探讨了几种有效执行此转换的方法，重点关注清晰度和处理各种字典结构。

1. 直接使用`pandas.DataFrame()`

最简单的方法是将您的字典直接传递给pandas.DataFrame()构造函数。但是，结果很大程度上取决于字典的结构。

场景1：字典的值为列表/数组

这是最直接的情况。每个键都成为一个列名，其对应的列表或数组构成该列的数据。


import pandas as pd

data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame(data)
print(df)

输出：


   col1  col2  col3
0     1     4     7
1     2     5     8
2     3     6     9

场景2：字典的字典或字典的列表

对于嵌套字典或字典列表，行为会发生变化。Pandas 会以不同的方式解释结构，如果内部字典一致，通常会产生想要的结果。


data = [{'col1': 1, 'col2': 4, 'col3': 7}, {'col1': 2, 'col2': 5, 'col3': 8}, {'col1': 3, 'col2': 6, 'col3': 9}]
df = pd.DataFrame(data)
print(df)

这将产生与场景1相同的输出。但是，不一致（缺少键）会导致问题。确保数据结构一致才能获得可靠的结果。

2. 利用`pandas.DataFrame.from_dict()`

from_dict()方法通过orient参数提供更多控制，指定如何解释字典：

'columns'：类似于上面的场景1。
'index'：键成为索引，值构成单列。
'rows'：列表中的每个字典都代表一行。


data = {'col1': [1, 2, 3], 'col2': [4, 5, 6], 'col3': [7, 8, 9]}
df = pd.DataFrame.from_dict(data, orient='columns')
print(df)

data2 = {'col1': 10, 'col2': 20, 'col3': 30}
df2 = pd.DataFrame.from_dict(data2, orient='index', columns=['Value'])
print(df2)

data3 = [{'col1': 1, 'col2': 4, 'col3': 7}, {'col1': 2, 'col2': 5, 'col3': 8}, {'col1': 3, 'col2': 6, 'col3': 9}]
df3 = pd.DataFrame.from_dict(data3, orient='rows')
print(df3)

3. 处理不规则的字典结构

对于键或值不一致的字典，预处理至关重要。考虑使用以下技术：

填充缺失值：使用fillna()用默认值（例如0或NaN）替换缺失值。
数据清洗：在转换之前标准化数据类型并处理不一致之处。
数据转换：将字典重构为更规则的格式，适合创建DataFrame。

通过仔细考虑字典的结构并使用适当的Pandas方法，您可以可靠有效地创建用于分析的DataFrame。

高效Python字典转Pandas DataFrame

目录

1. 直接使用`pandas.DataFrame()`

2. 利用`pandas.DataFrame.from_dict()`

3. 处理不规则的字典结构

发表回复取消回复

目录

1. 直接使用pandas.DataFrame()

2. 利用pandas.DataFrame.from_dict()

3. 处理不规则的字典结构

相关文章：

发表回复 取消回复

1. 直接使用`pandas.DataFrame()`

2. 利用`pandas.DataFrame.from_dict()`

发表回复取消回复