文档备案控制台

开发者社区问答正文

2千万的索引库，完全匹配字段时用lucene直接读库还是将数据封装到map中查找较好？：报错

现有2千万条数据的索引库（可能更多），每条数据包含两个字段(word、count),现在要输入一个word查找count值，请问如何使用才是最佳方案？
目前有三种想法：1.用lucene直接从硬盘读索引库进行匹配，
2将索引库预先加载到内存中匹配，
3将数据读取后封装成map,通过key查找value,请问哪种比较好？大侠们还有其它方案么？？？？

展开

收起

kun坤 2020-06-06 15:43:19 584 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

kun坤

要分词只能lucene，如果是纯==匹配，redis和memcached会更好；######不用分词，是完全匹配，，目前是用map封装，直接用KEY找Value，但是效率貌似不高######memcached######nosql数据库不正是你的绝佳选择吗######数据都是lucene建的本地索引，只能在代码上寻找新方法，换数据库不靠谱啊，客户的数据库都要求统一处理方式######增加一个hash字段，把word的hash值写在这个字段里，然后索引，查询的时候就用这个hash值进行查询，应该能提高性能

2020-06-06 15:43:25

赞同展开评论

问答分类：

索引

问答标签：

封装Map 数据Map Map报错库Map Map字段

问答地址：

开发者社区 > 云计算 > 问答

相关问答

Hologres创建maxcompute外表map类型字段在映射时为空

153

1

0

使用dataworks中系统自带的map函数构建字段，发现=变为了\u003d 什么原因？

1087

2

0

flink 使用MapState，我定义的对象里面包含了一些Map，序列化会报错，有什么办法嘛？

151

1

0

Maxcompute表中的map类型字段在创建外表的时候数据类型为空

150

1

0

ModelScope中这个map好像可能只支持999个，每次打到这里就报错，有什么办法解决么？

168

0

0

springboot应用的nacos配置类中【Map对象的某个字段为null】是什么原因？

404

1

0

datawork api看文档返回的是个map，如果我一次性要查很多条数据，该怎么用？

252

12

0

flink cdc 写代码的方式接收数据-map操作-sink到表是导入那个Maven依赖啊？

145

0

0

AI Earth的map.addLayer运行没有报错，但是地图上没有显示是什么原因？

135

0

0

为什么nacos-当配置存在map类型，移除元素无效，保留的还是原来的数据怎么办？

263

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

免费Token用出付费效果：OpenClaw全平台部署（阿里云/Win11/Mac/Linux）+6大省钱技能合集（Token省95%）+FAQ

OpenClaw 阿里云/本地零基础喂饭级部署+配置免费大模型API+集成Obsidian CLI，让AI用你的知识库创作！

大模型应用：大模型本地部署的磁盘空间优化：模型分片存储与按需加载.48

AI搜索来了，流量逻辑换了：GEO才是真正的新赛道

原理解读｜PolarDB-X 列存索引、列存快照

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

数据守护：防勒索攻击数据保障

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

还有其他疑问?