开发者社区> 问答> 正文

lucence 内部结构是什么

lucence 内部结构是什么

展开
收起
游客pklijor6gytpx 2019-12-05 15:29:47 3020 0
1 条回答
写回答
取消 提交回答
  • 索引(Index): 在Lucene中一个索引是放在一个文件夹中的。

    段(Segment): 一个索引可以包含多个段,段与段之间是独立的,添加新文档可以生成新的段,不同的段可以合并。

    segments.gen和segments_X是段的元数据文件,也即它们保存了段的属性信息。

    文档(Document): 文档是我们建索引的基本单位,不同的文档是保存在不同的段中的,一个段可以包含多篇文档。 新添加的文档是单独保存在一个新生成的段中,随着段的合并,不同的文档合并到同一个段中。

    域(Field): 一篇文档包含不同类型的信息,可以分开索引,比如标题,时间,正文,作者等,都可以保存在不同的域里。 不同域的索引方式可以不同,在真正解析域的存储的时候,我们会详细解读。

    词(Term): 词是索引的最小单位,是经过词法分析和语言处理后的字符串。

    2019-12-05 15:30:39
    赞同 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
为并行图数据处理提供高层抽象/语言 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载