开发者社区问答正文

将词典列表转换为panda数据流

我有一个Python字典列表，每个字典都有相同的键，

dict_keys= ['k1','k2','k3','k4','k5','k6'] # More like 30 keys in practice
data = []
for i in range(20): # More like 3000 in practice
    data.append({k: np.random.randint(100) for k in dict_keys})

并希望使用它创建一个相应的panda dataframe，其中包含一个键的子集。我目前的方法是每次从列表中提取一个dict，然后将它附加到dataframe中

df = pd.DataFrame(columns=['k1','k2','k5','k6'])
for d in data:
    df = df.append({k: d[k] for k in list(df.columns)}, ignore_index=True)
    # In practice, there are some calculations on some of the values here

但是这是非常慢的(实际的列表和它包含的dicts都非常大)。有没有一种更好、更快(也更习惯)的方法来遍历字典列表并将它们作为行添加到panda dataframe中? 问题来源StackOverflow 地址：/questions/59379339/from-list-of-dictionary-to-dataframe

展开

收起

kun坤 2019-12-30 09:33:53 512 版权

1 条回答

写回答

取消提交回答

kun坤

只需将数据传递给DataFrame的_init__，或者传递给DataFrame.from_records(两种方法都可以)。您可能还需要设置一个索引，例如datafame .from_records(data, index = 'k1')。如果您还需要执行一些计算，那么在创建数据流之后，在DataFrame上执行计算通常更容易、更方便。利用熊猫!

2019-12-30 09:33:58

赞同展开评论

问答分类：

自然语言处理 Python

问答地址：

开发者社区 > 人工智能 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

将词典列表转换为panda数据流

相关文章