还不会ES？Elasticsearch快速入门实操指南送上（上）-阿里云开发者社区

还不会ES？Elasticsearch快速入门实操指南送上（上）

2022-10-20 427 发布于辽宁

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 还不会ES？Elasticsearch快速入门实操指南送上（上）

前言

本文主要介绍ES的常用请求，让大家能快速上手ES的使用

主要参考官网的Quick start指引。

一、请求方式

向Elasticsearch发送请求主要有2种方式：

1、使用rest api发送http请求，比如curl命令

curl -X GET -u elastic:123456  "localhost:9200/?pretty"

2、使用Kibana’s console的请求工具

进入kibana界面，打开控制台——》开发工具

官网中的示例代码可以直接拷贝到Kibana中执行，也可以Copy as curl复制到服务器上执行curl请求。

通过设置按钮，还可以配置对应的kibana控制台的相关信息。这样当点击View in Console就能直接跳转到

我们自己安装的kibana的控制台。

这里为了请求的方便和简洁性，下面的演示中都是采用Kibana’s console的请求工具向ES发送请求。

二、创建索引

创建索引时，注意一下三点：

1、设置索引的settings属性

2、设置索引的mappings属性

3、设置索引的别名

官方文档：https://www.elastic.co/guide/en/elasticsearch/reference/7.13/indices-create-index.html

方式一：只创建索引

PUT my-index-000001

方式二：创建索引并同时指定settings、mappings、aliases

PUT my-index-000001
{
  "settings": {
        "number_of_shards": "4",
        "number_of_replicas": "0",
        "index": {
            "refresh_interval": "30s"
        }
  },
  "mappings": {
    "properties": {
      "content": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_smart"
      },
      "name": {
        "type": "keyword"
      },
      "age": {
        "type": "integer"
      },
      "@timestamp" : {
          "type" : "date"
        }
    }
  },
   "aliases": {
    "alias1": {}
  }
}

说明:

采用PUT命令创建索引my-index-000001，并同时设置索引的settings和mappings。

settings主要用来配置索引的一些全局属性，比如分片数，副本数，刷新频次，等。示例中通过number_of_shards指定了索引的分片数为1。

mappings主要用来声明索引中包含的字段和类型，对应关系型数据库中的表结构声明。

三、设置setting

number_of_shards

说明：索引分片数量

索引分片数在索引创建好了之后就不能调整了，只能重建索引

number_of_replicas

说明：用来控制索引的副本数量

index.refresh_interval

说明：索引刷新频率

数据写入后几秒可以被搜索到，默认是 1s。每次索引的 refresh 会产生一个新的 lucene 段, 这会导致频繁的合并行为，如果业务需求对实时性要求没那么高，可以将此参数调大，实际调优告诉我，该参数确实很给力，cpu 使用率直线下降。

设置settings：

PUT /my-index-000001
{
  "settings": {
    "index": {
      "number_of_shards": 3,  
      "number_of_replicas": 2 
    }
  }
}

也可以简写成：

PUT /my-index-000001
{
  "settings": {
    "number_of_shards": 3,
    "number_of_replicas": 2
  }
}

修改settings：

说明：修改索引的副本数目。

PUT my-index-000001/_settings
{
  "number_of_replicas": "2"
}

查看索引的详情：

GET /my-index-000001/

查看索引的settings：

GET /my-index-000001/_settings

查看索引的mapping：

GET /my-index-000001/_mapping

注意⚠️：

分片数number_of_shards的属性在索引创建后就不能修改了。

四、设置mapping

说明：

映射是定义文档及其包含的字段如何存储和索引的过程。

每个文档都是字段的集合，每个字段都有自己的数据类型。映射数据时，您创建一个映射定义，其中包含与文档相关的字段列表。映射定义还包括元数据字段，例如 _source 字段，用于自定义处理文档相关元数据的方式。

mapping属性主要用来设置索引中的字段名称和字段类型以及text字段的分词策略。

官网对mapping的介绍：

https://www.elastic.co/guide/en/elasticsearch/reference/7.13/mapping.html

mapping主要有2种类型：

1、自动映射 Dynamic mapping

当 Elasticsearch 在文档中检测到新字段时，它默认动态地将该字段添加到类型映射中。

也就是添加数据时，发现新的字段会自动添加类型映射。

2、精确映射 Explicit mapping

由用户自己定义索引的映射，这种方式会更加精准。

注意⚠️：

ES的mapping可以新增字段，但是对于已经存在的字段，只能添加属性，不能修改字段的类型。

如果需要修改已经存在的字段的type类型，只能进行重建索引reindex。

ES的mapping并不是不能修改，只是不能对已经存在的字段类型进行修改。

获取索引的mapping信息

GET /my-index-000001/_mapping

获取索引中单个字段的mapping信息

GET /my-index-000001/_mapping/field/content

设置mapping信息

PUT /my-index-000001/_mapping
{
     "dynamic": false, 
     "properties": {
      "content": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_smart"
      },
      "name": {
        "type": "keyword"
      },
      "age": {
        "type": "integer"
      },
      "@timestamp" : {
          "type" : "date",
          "format": "yyyy-MM-dd HH:mm:ss"
        }
    }
}

或

PUT /my-index-000001
{
  "mappings": {
    "dynamic": false, 
    "properties": {
      "content": {
        "type": "text",
        "analyzer": "ik_max_word",
        "search_analyzer": "ik_smart"
      },
      "name": {
        "type": "keyword"
      },
      "age": {
        "type": "integer"
      },
      "@timestamp" : {
          "type" : "date",
          "format": "yyyy-MM-dd HH:mm:ss"
        }
    }
  }
}

说明：

给索引添加4个字段，content、name、age、@timestamp。

其中content类型为text，会进行分词匹配，设置分词器为ik_max_word，查询分词器为ik_smart。

如果时间字段需要指定多种格式，可以采用如下方式声明：

"create_time" : {
     "type" : "date",
    "format" : "yyyy-MM-dd HH:mm:ss||yyyy-MM-dd||epoch_millis"
}

dynamic 参数控制是否动态添加新字段，并接受以下参数：

true

新字段被添加到映射中（默认）。

runtime

新字段作为运行时字段添加到映射中。这些字段未编入索引，并在查询时从 _source 加载。

false

新字段将被忽略。这些字段不会被索引或可搜索，但仍会出现在返回命中的 _source 字段中。这些字段不会添加到映射中，必须显式添加新字段。

strict

如果检测到新字段，则会抛出异常并拒绝文档。新字段必须显式添加到映射中。

给索引增加一个新的字段映射：

PUT /my-index-000001/_mapping
{
  "properties": {
    "email": {
      "type": "keyword"
    }
  }
}

五、设置索引别名

官网介绍：https://www.elastic.co/guide/en/elasticsearch/reference/7.13/indices-aliases.html

索引别名是用于引用一个或多个现有索引的辅助名称。

大多数 Elasticsearch API 接受索引别名来代替索引。

一个索引别名能关联多个索引。可以用索引别名来代替真实索引名称查询。

方式一：创建索引时指定别名

PUT /my-index-000001
{
  "aliases": {
    "alias_1": {}
  }
}

方式二：给已经存在的索引新增索引别名

POST /_aliases
{
  "actions" : [
    { "add" : { "index" : "my-index-000001", "alias" : "alias1" } }
  ]
}

移除索引别名：

POST /_aliases
{
  "actions" : [
    { "remove" : { "index" : "my-index-000001", "alias" : "alias1" } }
  ]
}

重命名索引别名：

POST /_aliases
{
  "actions" : [
    { "remove" : { "index" : "my-index-000001", "alias" : "alias1" } },
    { "add" : { "index" : "my-index-000001", "alias" : "alias2" } }
  ]
}

六、添加数据

1、单条添加

指定索引ID添加单条数据

PUT /my-index-000001/_doc/1
{"content": "小天今天在研究大数据", "name": "小天", "age": 25,"@timestamp": "2018-05-08 16:25:42"}

自动生成索引ID添加单条数据

POST my-index-000001/_doc
{"content": "小天尝试通过POST添加单条数据", "name": "小天", "age": 25,"@timestamp": "2018-05-08 16:25:42"}
POST /my-index-000001/_doc?op_type=create
{"content": "小天今天去钓鱼", "name": "小天", "age": 25,"@timestamp": "2018-05-08 16:25:42"}

2、批量添加

通过bulk命令实现批量添加数据，可以通过create属性指定id，如果不指定则自动生成索引ID。

PUT /my-index-000001/_bulk
{ "create": { } }
{"content": "小明同学觉得java是最好的编程语言", "name": "小明", "age": 20,"@timestamp": "2020-05-08 16:25:42"}
{ "create":  {  "_id": "20210602060517329146" }}
{"content": "小明同学今天学习编程5个小时", "name": "小明", "age": 20,"@timestamp": "2020-05-08 16:25:42"}

通过添加refresh，批量添加数据后，立刻刷新索引。保证大批量的添加数据后，索引立刻刷新，可以立刻被检索到。

PUT /my-index-000001/_bulk?refresh
{ "create": { } }
{"content": "路见不平，拔刀相助", "name": "小李", "age": 29,"@timestamp": "2019-05-08 16:25:42"}

七、关闭索引

POST /my-index-000001/_close?wait_for_active_shards=0

八、开启索引

POST /my-index-000001/_open

还不会ES？Elasticsearch快速入门实操指南送上（上）

前言

一、请求方式

二、创建索引

三、设置setting

四、设置mapping

五、设置索引别名

六、添加数据

1、单条添加

2、批量添加

七、关闭索引

八、开启索引

热门文章

最新文章

相关课程

相关电子书

相关实验场景

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

还不会ES？Elasticsearch快速入门实操指南送上（上）

前言

一、请求方式

二、创建索引

三、设置setting

四、设置mapping

五、设置索引别名

六、添加数据

1、单条添加

2、批量添加

七、关闭索引

八、开启索引

热门文章

最新文章

相关课程

相关电子书

相关实验场景