开发者社区 问答 正文

Havenask这里主要各种是block cache、bloom filter等相关东西重新算吧?

Havenask这里主要各种是block cache、bloom filter等相关东西重新算,类似这些事情吧?关于merge,比如在线端,加载了10个已有数据作为磁盘型的segment,同时增量不定期更新,也就是还有一个内存型segment慢慢在写入,那么日常的查询请求,就是查10+1=11个segment;
如果我开启了auto_merge,就会每merge_internal_ms时间,把当前全部segment做个compact,类似rocksdb,给删除的彻底删除,同key的合并value,最终segment数目降低一些是吧

展开
收起
三分钟热度的鱼 2024-05-23 09:15:00 31 分享 版权
1 条回答
写回答
取消 提交回答
  • 差不多,倒排链过长的时候按照某些feature构建出更短更重要的倒排链作为辅助查询,牺牲召回文档数,提升查询性能 此回答整理自钉群“Havenask开源官方技术交流群”

    2024-05-23 10:21:02
    赞同 展开评论