Elasticsearch 中索引文档的一般过程:
- 创建索引(Index):在 Elasticsearch 中,首先需要为文档指定一个索引,索引是文档的逻辑容器,类似于关系型数据库中的数据库。可以通过 REST API 或者编程客户端创建索引。
- 定义映射(Mapping):在创建索引时,可以定义文档的映射,即每个字段的数据类型和属性。映射定义了文档的结构,包括字段名、数据类型、分词器等信息。
- 索引文档(Indexing):一旦索引和映射准备就绪,就可以开始索引文档了。文档是 Elasticsearch 存储、索引和搜索的基本单位,通常以 JSON 格式表示。将文档发送到 Elasticsearch 的特定索引中,Elasticsearch 将文档解析、索引并存储。
- 文档存储:Elasticsearch 将文档存储在倒排索引中,以便快速地进行全文搜索。文档被分割成多个字段,并根据字段类型进行索引化处理。如果是要索引且需要分词的,则先利用分词器进行分词,过滤,然后再形成倒排索引。