开发者社区> 问答> 正文

我现在有两万条数据,要通过id查找对应数据,是遍历一遍放到dict里面查找快,还是放到pandas的DataFrame里面查找快?

python小能手 2019-06-13 10:44:25 126

我现在有两万条数据,要通过id查找对应数据,是遍历一遍放到dict里面查找快,还是放到pandas的DataFrame里面查找快?

分享到
取消 提交回答
全部回答(1)
  • python小能手
    2019-07-17 23:37:08

    刚才测试了一下,2w条数据查找8w次 list转成hash再查询比pandas快200倍。。
    pandas是这样写的
    data_df[data_df['borough_id'] == i.get("_id")]['avg_price'].tolist()
    hash就是用
    boroughDict.get(i.get("_id"))

    0 0