Elasticsearch Mapping是啥？-阿里云开发者社区

Elasticsearch Mapping是啥？

2024-01-12 1630

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Elasticsearch Mapping是啥？

什么是Mapping

我们知道，es如果对应数据表，表中的数据是不是有数据类型，那么es的mapping就是来设置这个字段类型的。它的主要作用：

定义字段名称
定义字段的数据类型，例如字符串、数值等
字段倒排索引的相关配置，比如说可以通过配置字段是否需要被索引

Mapping 会把 Json 文档映射成 Lucene 所需的扁平格式
一个 Mapping 属于一个索引的 Type ，在 7.0 之后版本索引只有一个 Type（_doc）

常用来设置 Mapping 的数据类型

简单类型

Text/Keyword
Date
Integer/Float/Double/Long
Boolean
Ip

这里说明一下Text和Ketword类型的区别

在es5之前是string，后面拆分成了Text和Keyword

按照官方文档的阐述，text类型的数据用来索引长文本，例如电子邮箱主体部分或者一些产品的介绍，这些文本会被分析，在建立索引后被分词器进行分词，转化为词组。经过分词机制后es允许检索到该文本切分而成的词语，但text类型的数据不能用来做过滤、排序、聚合等操作

keyword类型的数据可以满足电子邮箱、主机名、状态码等数据的要求，不进行分词，常常被用来做过滤、排序、聚合等操作

复杂类型-对象和嵌套对象

对象类型/嵌套类型

特殊类型(针对地理位置信息有特殊处理)

geo_point
geo_shape / percolator

Dynamic Mapping

简单来说，如果你不手动创建Mapping，es会自动根据json来推断数据类型，但是不准确，这个的话我一般不会自动映射，所以大家知道一下这个就ok

手动创建 Mapping

PUT phone
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text"
      },
      "cpu": {
        "type": "text"
      },
      "created_at": {
        "type": "date"
      },
      "system_code": {
        "type": "integer",
        "index": false
      }
    }
  }
}
POST phone/_doc
{
  "name": "苹果",
  "cpu": "4核",
  "created_at": "2019-11-01",
  "system_code": 111 
}
POST phone/_doc
{
  "name": "华为",
  "cpu": "4核",
  "created_at": "2020-11-01",
  "system_code": 221
}
GET phone/_search
{
  "query": {
    "match": {
      "system_code": {
        "query": 111
      }
    }
  }
}

上面建立mapping的时候，我对system_code这个字段index设置为false，es将不会对这个字段建立倒排索引

Index Options

ES 有四种不同级别的 Index Options 配置

docs 记录 doc id
freqs 记录 doc id 和 term 频次
positions 记录 doc id 和 term 频次和 term 位置
offsets 记录 doc id 和 term 频次和 term 位置和字符偏移量

Text 类型默认 positions，其他默认为 docs

copy_to

copy_to 是为瞒足一些特定搜素需求，将多个字段数值拷贝到目标字段，目标字段不会出现在 _source。

PUT phone_1
{
  "mappings": {
    "properties": {
      "name": {
        "type": "text",
        "copy_to": "fullname"
      },
      "cpu": {
        "type": "text",
        "copy_to": "fullname"
      },
      "created_at": {
        "type": "date"
      },
      "system_code": {
        "type": "integer",
        "index": false
      }
    }
  }
}
POST phone_1/_doc
{
  "name": "苹果",
  "cpu": "4核",
  "created_at": "2019-11-01",
  "system_code": 111 
}
POST phone_1/_doc
{
  "name": "华为",
  "cpu": "4核",
  "created_at": "2020-11-01",
  "system_code": 221
}
GET phone_1/_search
{
  "query": {
    "match": {
      "fullname": {
        "query": "华为4核"
      }
    }
  }
}

查询的时候，fullname并没有在mapping中声明，照样可以进行合并搜索

Elasticsearch Mapping是啥？

什么是Mapping

常用来设置 Mapping 的数据类型

Dynamic Mapping

手动创建 Mapping

Index Options

copy_to

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Elasticsearch Mapping是啥？

什么是Mapping

常用来设置 Mapping 的数据类型

Dynamic Mapping

手动创建 Mapping

Index Options

copy_to

热门文章

最新文章

相关课程

相关电子书