Elasticsearch 性能调优指南——推荐实战 DSL

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 本文是在以下 6 篇基础上的继续扩展版本,不求大而全,只求对实战有帮助。1、干货 | Elasticsearch 运维实战常用命令清单2、干货 | Elasticsearch Top10 监控指标3、你不得不关注的 Elasticsearch Top X 关键指标4、干货 | Elasticsearch 开发实战常用命令清单5、干货 | Elasticsearch开发人员最佳实战指南6、Elasitcsearch 开发运维常用命令集锦

1、未分配分片查看

GET _cat/shards?v&h=index,shard,prirep,state,unassigned.reason&s=state:asc

2、动态调整副本数

PUT my-index-2021.05.30-000002/_settings

{"number_of_replicas": 0}

ps:主分片不可以修改(除非shrink),但:副本可以动态调整大小。


3、重新打开分片分配策略

PUT /_cluster/settings

{

 "transient": {

   "cluster.routing.allocation.enable": "all"

 }

}

4、手动移动未分配的分片

POST /_cluster/reroute

{

 "commands": [

   {

     "move": {

       "index": "test",

       "shard": 0,

       "from_node": "node1",

       "to_node": "node2"

     }

   },

   {

     "allocate_replica": {

       "index": "test",

       "shard": 1,

       "node": "node3"

     }

   }

 ]

}

5、查看磁盘使用率

GET /_cat/allocation?v

使用率大于等于85%,知道已经达到警戒水位线了,要预警。


6、查看各个节点的版本号

GET /_cat/nodes?v&h=host,name,version

集群多节点版本不一致,可能会引发各种未知异常。


7、检索性能调优实战

7.1 慢日志设置

PUT /my-index-000001/_settings

{

 "index.search.slowlog.threshold.query.warn": "10s",

 "index.search.slowlog.threshold.query.info": "5s",

 "index.search.slowlog.threshold.query.debug": "2s",

 "index.search.slowlog.threshold.query.trace": "500ms",

 "index.search.slowlog.threshold.fetch.warn": "1s",

 "index.search.slowlog.threshold.fetch.info": "800ms",

 "index.search.slowlog.threshold.fetch.debug": "500ms",

 "index.search.slowlog.threshold.fetch.trace": "200ms",

 "index.search.slowlog.level": "info"

}

7.2 构建Mapping 设置路由

PUT my-index-000002

{

 "mappings": {

   "_routing": {

     "required": true

   }

 }

}

7.3 段合并

POST /my-index-000001/_forcemerge

8、写入优化篇

8.1 批量写入

POST _bulk

{ "index" : { "_index" : "test", "_id" : "1" } }

{ "field1" : "value1" }

{ "delete" : { "_index" : "test", "_id" : "2" } }

{ "create" : { "_index" : "test", "_id" : "3" } }

{ "field1" : "value3" }

{ "update" : {"_id" : "1", "_index" : "test"} }

{ "doc" : {"field2" : "value2"} }

8.2 增加刷新频率

PUT /my-index-000001/_settings

{

 "index" : {

   "refresh_interval" : "30s"

 }

}

8.3 副本设置为0,提升写入

PUT my-index-000001/_settings

{

 "number_of_replicas": 0

}

8.4 translog 异步刷盘

PUT my-index-2021.06.03/_settings

{

 "index": {

   "translog": {

     "durability": "async"

   }

 }

}

9、堆内存调优实战

在 jvm.option 配置文件中(不支持动态调整,需要重启后生效)


ES_HEAP_SIZE=DESIRED_SIZE (e.g. "3g")

10、磁盘不足解决方案

磁盘的三个警戒水位线需要再一次强调。如果 Elasticsearch 集群节点的磁盘空间不足,则会影响集群性能。


一旦可用存储空间低于特定阈值限制,它将开始阻止写入操作,进而影响数据进入集群。那么,如何扩展呢?


三个警戒水位线推荐阅读:你不得不关注的 Elasticsearch Top X 关键指标。


第一:横向扩展,添加数据节点(前提分片分配相对合理)。


第二:纵向扩展,升级机器,加磁盘(可能需要调整data.path)。


第三:迁移数据,历史久远不用数据可以考虑迁移到别的集群,或者归档到别的机器。


小结

性能调优非一朝一夕之功,推荐阅读官方文档的:“How to ” 部分。该部分针对写入、检索等性能优化,更加细致、全面有针对性。

image.png

本文是从命令行排查问题角度出发做的小结,希望对大家排查线上问题有所帮助。关于性能优化,结合如下几篇实战文章,能进一步提升认知。


Elasticsearch性能优化实战指南


让Elasticsearch飞起来!——性能优化实践干货


Elasticsearch大文件检索性能提升20倍实践(干货)


Elasticsearch 聚合性能优化六大猛招


Elasticsearch 高基数聚合性能提升3倍,改动了什么?


参考

elasticsearch_monitoring_cheatsheet.pdf


https://www.elastic.co/guide/en/elasticsearch/reference/7.14/modules-cluster.html#disk-based-shard-allocation


https://www.elastic.co/guide/en/elasticsearch/reference/7.14/how-to.html

相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
相关文章
|
3月前
|
缓存 固态存储 Java
Elasticsearch 的扩展性和性能调优
【9月更文第2天】Elasticsearch 是一个分布式的搜索和分析引擎,适用于各种大规模数据处理场景。随着数据量的增长和查询复杂度的增加,Elasticsearch 的性能优化变得尤为重要。本文将详细介绍如何通过硬件配置、集群规模调整以及查询优化策略来提升 Elasticsearch 的性能。
217 6
|
2月前
|
存储 缓存 监控
深入解析:Elasticsearch集群性能调优策略与最佳实践
【10月更文挑战第8天】Elasticsearch 是一个分布式的、基于 RESTful 风格的搜索和数据分析引擎,它能够快速地存储、搜索和分析大量数据。随着企业对实时数据处理需求的增长,Elasticsearch 被广泛应用于日志分析、全文搜索、安全信息和事件管理(SIEM)等领域。然而,为了确保 Elasticsearch 集群能够高效运行并满足业务需求,需要进行一系列的性能调优工作。
101 3
|
3月前
|
JSON 自然语言处理 算法
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
DSL查询文档、RestClient查询文档、全文检索查询、精准查询、复合查询、地理坐标查询、分页、排序、高亮、黑马旅游案例
ElasticSearch基础2——DSL查询文档,黑马旅游项目查询功能
|
5月前
|
存储 数据库 索引
面试题ES问题之动态映射的定义如何解决
面试题ES问题之动态映射的定义如何解决
38 1
|
5月前
|
存储 数据采集 数据处理
数据处理神器Elasticsearch_Pipeline:原理、配置与实战指南
数据处理神器Elasticsearch_Pipeline:原理、配置与实战指南
180 12
|
6月前
|
缓存 数据处理 数据安全/隐私保护
Elasticsearch索引状态管理实战指南
Elasticsearch索引状态管理实战指南
|
6月前
|
存储 索引
Elasticsearch索引之嵌套类型:深度剖析与实战应用
Elasticsearch索引之嵌套类型:深度剖析与实战应用
|
6月前
|
存储 JSON 搜索推荐
Springboot2.x整合ElasticSearch7.x实战(三)
Springboot2.x整合ElasticSearch7.x实战(三)
50 0
|
6月前
|
存储 自然语言处理 关系型数据库
Springboot2.x整合ElasticSearch7.x实战(二)
Springboot2.x整合ElasticSearch7.x实战(二)
53 0
|
6月前
|
搜索推荐 数据可视化 Java
Springboot2.x整合ElasticSearch7.x实战(一)
Springboot2.x整合ElasticSearch7.x实战(一)
48 0
下一篇
无影云桌面