开发者社区> 问答> 正文

2千万的索引库,完全匹配字段时用lucene直接读库还是将数据封装到map中查找较好?:报错

现有2千万条数据的索引库(可能更多),每条数据包含两个字段(word、count),现在要输入一个word查找count值,请问如何使用才是最佳方案?
目前有三种想法:1.用lucene直接从硬盘读索引库进行匹配,
                        2将索引库预先加载到内存中匹配,
                        3将数据读取后封装成map,通过key查找value,请问哪种比较好?大侠们还有其它方案么????

展开
收起
kun坤 2020-06-06 15:43:19 537 0
1 条回答
写回答
取消 提交回答
  • 要分词只能lucene,如果是纯==匹配,redis和memcached会更好;######不用分词,是完全匹配,,目前是用map封装,直接用KEY找Value,但是效率貌似不高######memcached######nosql数据库不正是你的绝佳选择吗######数据 都是lucene建的本地索引,只能在代码上寻找新方法,换数据库不靠谱啊,客户的数据库都要求统一处理方式######增加一个hash字段,把word的hash值写在这个字段里,然后索引,查询的时候就用这个hash值进行查询,应该能提高性能

    2020-06-06 15:43:25
    赞同 展开评论 打赏
问答分类:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
RowKey与索引设计:技巧与案例分析 立即下载
Phoenix 全局索引原理与实践 立即下载
低代码开发师(初级)实战教程 立即下载