Elasticsearch-04 ES中的术语和基本用法

2023-05-26 327

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Elasticsearch-04 ES中的术语和基本用法

概述

有时候对象不仅仅只是简单的键值列表，更多时候它拥有复杂的数据结构，比如包含日期、地理位置、另一个对象或者数组。

将这些数据保存到由行和列组成的关系数据库中，就好像是把一个丰富的对象拆散了放入一个非常大的表格中：你不得不拆散对象以适应表模式（通常一列表示一个字段），然后又不得不在查询的时候重建它们。

Elasticsearch是面向文档(document oriented)的，这意味着它可以存储整个对象或文档即document

然而它不仅仅是存储，还会索引(index)每个文档的内容使之可以被搜索

在Elasticsearch中，你可以对文档（而非成行成列的数据）进行索引、搜索、排序、过滤。这也是Elasticsearch能够执行复杂的全文搜索的原因之一

Elasticsearch使JSON 作为文档序列化格式。

术语

索引：含有相同属性的文档集合，相当于关系型数据库中的database
类型：索引可以定义一个或多个类型，文档必须属于一个类型，相当于table
文档：文档是可以被索引的基本数据单位 ,相当于一条记录

Elasticsearch -> Indexes-> Types -> Documents -> Fields
Relational DB -> Databases -> Tables -> Rows -> Columns

和索引相关的有“分片”和“备份”

分片：每个索引都有多个分片，每个分片是一个Lucene索引

假如一个索引数据量很大，就会产生硬盘压力很大。所以就要‘分片’来分担压力。可以水平的扩展和拆分以及分布式的操作,可以提高搜索和其他操作

备份：拷贝一份分片就完成了分片的备份

当一个主分片失败或出现问题时,"备份分片"就可以代替工作,从而提高了ES的可用性,备份的分片还可以执行搜索的操作，来分摊搜索的压力。

ES创建索引时默认创建5个分片一个备份 , 分片的数量只能在创建索引时指定，备份可以动态修改

索引命名规范：字母小写，且不含中划线

基本用法

使用RESTful API，通过9200端口的与Elasticsearch进行通信

http://<ip>:<port>/<索引>/<类型>/<文档id>

HTTP方法：

GET , POST , PUT , HEAD , DELETE

创建索引

非结构化创建

粗线框代表主分片，对应的相同数字的细线框则代表备份，我们创建book索引的时候，默认5个分片（0，1，2，3，4）以及一个备份，如上所示。

怎么确定是非结构化的呢？

结构化的关键词 mappings，为空说明为非结构化,并没有结构映射的信息。

结构化创建

{
  "novel": {
    "properties": {
      "title": {
        "type": "text"
      }
    }
  }
}

点击Request，返回成功后，回到overview刷新下索引，查看索引信息如下

在web页面书写json没有提示，很容易出错，这里我们通过postman来新建一个索引吧

{
  "settings":{
    "number_of_shards":3,
    "number_of_replicas":1
  },
  "mappings":{
    "man":{
      "properties":{
        "name":{
          "type":"text"
        },
        "country":{
          "type":"keyword"
        },
        "age":{
          "type":"integer"
        },
        "date":{
          "type":"date",
          "format":"yyyy-MM-dd HH:mm:ss || yyyy-MM-dd || epoch_millis"
        }
      }
    },
    "woman":{
    }
  }
}

时间格式 epoch_millis为时间戳格式

body为json格式，请求方法为put , 请求url为 http://localhost:9200/people

返回结果：

{
    "acknowledged": true,
    "shards_acknowledged": true,
    "index": "people"
}

通过head插件查看结果,刷新下

查看索引信息如下

官方API文档

当前版本 7.0 ： https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

5.6的版本的： https://www.elastic.co/guide/en/elasticsearch/reference/5.6/index.html

插入

我们往 people 这个索引中的 man类型里写入一条数据即文档

指定文档id插入（PUT方法）

{
  "name":"artisan",
  "country":"china",
  "age":18,
  "date":"2019-04-19"
}

PUT 方法

http://localhost:9200/people/man/1 -->" ip:port/索引/类型/文档id

到head插件中查看下数据

id=1 ,是我们自己指定的

指定生成文档id插入（POST方法）

POST 方法

RestFul 请求中仅指定索引和类型即可，无需指定id,es自动生成id

在head插件中刷新下，通过Brower浏览数据如下

修改

直接修改文档

URL: http://localhost:9200/people/man/1/_update 指定id ,注意后面要跟上“_update”

方法： POST

修改内容

“doc”：{
   需要修改的信息
}

head插件查看修改后的数据

脚本修改文档

{
  "script":{
    "lang":"painless",
    "inline":"ctx._source.age += 10"
  }
}

或者，将参数放在外面指定，比如

{
  "script":{
    "lang":"painless",
    "inline":"ctx._source.age = params.age",
    "params":{
      "age":99
    }
  }
}

删除

删除Document 文档

URL : http://localhost:9200/people/man/1/ ，删除id=1的文档

方法： DELETE

通过head插件查看，刚才id=1的数据已经被删掉了

删除 index 索引

方式一： web页面中删除

索引被删除后，索引中的数据将一并被删除 ,请谨慎操作。

方式二：通过postman ,

方法： DELETE， url ： http://ip:port/index

通过head插件查看

查询

另开篇介绍，见ElasticSearch-05ElasticSearch之查询与过滤

Elasticsearch-04 ES中的术语和基本用法

概述

术语

基本用法

创建索引

非结构化创建

结构化创建

官方API文档

插入

指定文档id插入（PUT方法）

指定生成文档id插入（POST方法）

修改

直接修改文档

脚本修改文档

删除

删除Document 文档

删除 index 索引

查询

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Elasticsearch-04 ES中的术语和基本用法

概述

术语

基本用法

创建索引

非结构化创建

结构化创建

官方API文档

插入

指定文档id插入（PUT方法）

指定生成文档id插入 （POST方法）

修改

直接修改文档

脚本修改文档

删除

删除Document 文档

删除 index 索引

查询

热门文章

最新文章

相关课程

相关电子书

指定生成文档id插入（POST方法）