开发者社区 问答 正文

我现在有两万条数据,要通过id查找对应数据,是遍历一遍放到dict里面查找快,还是放到pandas的DataFrame里面查找快?

我现在有两万条数据,要通过id查找对应数据,是遍历一遍放到dict里面查找快,还是放到pandas的DataFrame里面查找快?

展开
收起
一码平川MACHEL 2019-06-13 10:44:25 3482 分享 版权
1 条回答
写回答
取消 提交回答
  • 刚才测试了一下,2w条数据查找8w次 list转成hash再查询比pandas快200倍。。
    pandas是这样写的
    data_df[data_df['borough_id'] == i.get("_id")]['avg_price'].tolist()
    hash就是用
    boroughDict.get(i.get("_id"))

    2019-07-17 23:37:08
    赞同 1 展开评论