Elasticsearch—生产环境集群核心配置

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: Elasticsearch—生产环境集群核心配置

一. Elasticsearch相关配置

path.data 和 path.log

这两个配置的目录分别用来存放索引数据日志,它们的默认路径位于$_ES_HOME的子文件夹内。这样有很大风险,特别是在升级Elasticsearch版本时,这些数据很可能被删除,在生产环境中可参考下面的配置

path:
  logs: /var/log/elasticsearch
  data: /var/data/elasticsearch

另外path.data支持配置多个目录,每个目录都会用来存放数据,但是单个分片会存放在同一个目录内,多目录配置参考

path:
  data:
    - /mnt/elasticsearch_1
    - /mnt/elasticsearch_2
    - /mnt/elasticsearch_3

集群名称

默认情况下集群名为elasticsearch,为了区分不同集群,在生产环境需要进行修改。每个节点需要配置相同的集群名才能加入同一个集群中,且每个节点只能加入一个集群,要保证集群名相同,否则会加入错误的集群中。

cluster.name: test-cluster

节点名称

默认情况下节点名称是操作系统的主机名,在Linux下使用hostname -f可查看主机名。也可通过elasticsearch.yml 配置文件显示的配置,使可读性更好。配置示例如下

node.name: test-node

网络地址 network.host

默认配置下,Elasticsearch绑定的是一个环回地址127.0.0.1 ,这只适合在单机开发时使用。在正式环境中,为了保证该节点能够被其它节点找到,形成一个集群,需要设置一个非环回地址,如果在内网中部署集群,可通过ifconfig命令查看当前节点的内网ip地址。配置如下

network.host: 192.168.60.11

服务发现和集群形成设置

1. 服务发现种子主机 discovery.seed_hosts

在开发环境中,服务发现主机名不需要设置,Elasticsearch默认会从本机的9300-9305端口尝试去连接其它节点,这提供了自动集群的体验,不需要任何配置。但在正式环境中,每个节点理论上都是不同的机器,这时候需要配置discovery.seed_hosts,discovery.seed_hosts可以是ip、ip:端口和域名。如果配置是ip,Elasticsearch默认会使用transport.profiles.default.port配置项的端口,该端口默认为9300;如果配置是域名,且该域名下绑定了多个ip,ES会尝试去连接多个ip。下面是配置示例

discovery.seed_hosts:
   - 192.168.1.10:9300
   - 192.168.1.11 
   - seeds.mydomain.com 

2. 初始主节点 cluster.initial_master_nodes


当开启一个全新的集群时,会有一个集群的引导步骤,这步骤用来确定哪些节点参与第一次的主节点选举。在开发模式下,这个步骤由节点自动完成,这种模式本质上是不安全的,因为不是所有节点都适合做主节点,主节点关系到集群的稳定性。因此在生产模式下,集群第一次启动时,需要有一个适合作为主节点的节点列表,这个列表就是通过cluster.initial_master_nodes来配置,在配置中需要写出具体的节点名称,对应node.name配置项。配置示例如下

cluster.initial_master_nodes: 
   - master-node-a
   - master-node-b
   - master-node-c

设置堆内存容量

默认情况下,Elasticsearch中JVM堆内存的最小值和最大值为1GB,在生产模式下,堆内存容量是非常重要的,需要确保Elasticsearch有足够的堆内存可用。我们可以在jvm.options 配置文件中,通过配置Xmx 和Xms项来决定JVM堆内存容量,配置的容量本身也取决于服务器的物理内存,Xmx 和Xms的值不超过物理内存的50%。因为Elasticsearch除了堆内存,也会有其它的操作,比如使用堆外缓冲区进行网络通信,通过操作系统的文件系统缓存来访问文件,还有JVM自身也需要一些内存。对内存容量,最大可设置接近32GB,26GB是安全值,有些系统下可到达30GB。示例配置如下

-Xms2g 
-Xmx2g 

二. 操作系统配置

文件描述符

Linux默认配置下最大打开文件数为1024,可通过ulimit -n查看,而ES在建索引过程中会打开很多小文件,这样很容易超过限制,文件描述符临时设置命令如下

sudo su  
ulimit -n 65535 
su elasticsearch 

永久设置可修改/etc/security/limits.conf文件

elasticsearch - nofile 65535

上面的配置表示设置elasticsearch用户下,打开文件描述符最大数量为65535。

禁止交换空间

Linux的交换空间机制是指,当内存资源不足时,Linux把某些页的内容转移至硬盘上的一块空间上,以释放内存空间。硬盘上的那块空间叫做交换空间(swap space)。如果不关闭swap,Elasticsearch的堆内存可能会被挤到磁盘中,垃圾回收速度会从毫秒级别变成分钟级别,导致节点的响应速度慢甚至和集群断开连接。有三种方式来避免交换空间发生


1.禁止所有交换空间

在Linux上,临时关闭操作系统交换空间可执行下面命令

sudo swapoff -a

永久关闭需要修改/etc/fstab 文件。

2.配置swappiness

修改 /etc/sysctl.conf文件,设置vm.swappiness = 1,可以使Linux在一般情况下不使用交换,除非万不得已。

3.使用内存锁

使用内存锁可以在ES启动时,锁住一段堆内存,保证堆内存不被挤到磁盘中,对应Linux中的mlockall 系统调用,在ES中配置config/elasticsearch.yml 文件。配置如下

bootstrap.memory_lock: true

虚拟内存

Elasticsearch通过文件映射(mmap)来读取磁盘中的文件,这样可以比read系统调用少一次内存拷贝,也被称为0拷贝技术。ES映射的文件会很多,所以需要修改最大映射文件的数量,通过修改vm.max_map_count配置项可实现。临时修改可调用下面命令

sysctl -w vm.max_map_count=262144

要永久修改这个值,需要修改/etc/sysctl.conf文件,增加如下行

vm.max_map_count=262144

然后再运行sysctl -p 重新加载系统配置才会生效,最后运行sysctl vm.max_map_count命令检测设置是否生效。

设置线程

Elasticsearch中不同的操作有不同的线程池,为了确保Elasticsearch线程正常创建线程,需要设置操作系统的线程数限制。最小值为4096,可通过修改/etc/security/limits.conf来完成设置。

总结

以上的配置在生产环境中都很重要,大部分参考了官方文档,结合了自己的理解,如有描述错误的地方,请指正。希望对你有帮助,谢谢!

 

参考:https://segmentfault.com/a/1190000019900040


相关实践学习
使用阿里云Elasticsearch体验信息检索加速
通过创建登录阿里云Elasticsearch集群,使用DataWorks将MySQL数据同步至Elasticsearch,体验多条件检索效果,简单展示数据同步和信息检索加速的过程和操作。
ElasticSearch 入门精讲
ElasticSearch是一个开源的、基于Lucene的、分布式、高扩展、高实时的搜索与数据分析引擎。根据DB-Engines的排名显示,Elasticsearch是最受欢迎的企业搜索引擎,其次是Apache Solr(也是基于Lucene)。 ElasticSearch的实现原理主要分为以下几个步骤: 用户将数据提交到Elastic Search 数据库中 通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据 当用户搜索数据时候,再根据权重将结果排名、打分 将返回结果呈现给用户 Elasticsearch可以用于搜索各种文档。它提供可扩展的搜索,具有接近实时的搜索,并支持多租户。
目录
相关文章
|
2月前
|
存储 负载均衡 Java
Elasticsearch集群面试系列文章一
【9月更文挑战第9天】Elasticsearch(简称ES)是一种基于Lucene构建的分布式搜索和分析引擎,广泛用于全文搜索、结构化搜索、分析以及日志实时分析等场景。
99 7
|
3月前
|
存储 缓存 监控
|
3月前
|
存储 监控 负载均衡
检索服务elasticsearch集群(Cluster)
【8月更文挑战第23天】
63 3
|
27天前
|
存储 缓存 监控
深入解析:Elasticsearch集群性能调优策略与最佳实践
【10月更文挑战第8天】Elasticsearch 是一个分布式的、基于 RESTful 风格的搜索和数据分析引擎,它能够快速地存储、搜索和分析大量数据。随着企业对实时数据处理需求的增长,Elasticsearch 被广泛应用于日志分析、全文搜索、安全信息和事件管理(SIEM)等领域。然而,为了确保 Elasticsearch 集群能够高效运行并满足业务需求,需要进行一系列的性能调优工作。
54 3
|
30天前
|
SQL 分布式计算 NoSQL
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
大数据-170 Elasticsearch 云服务器三节点集群搭建 测试运行
38 4
|
30天前
|
运维 监控 数据可视化
大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试
大数据-171 Elasticsearch ES-Head 与 Kibana 配置 使用 测试
53 1
|
2月前
|
存储 自然语言处理 关系型数据库
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
聚合、补全、RabbitMQ消息同步、集群、脑裂问题、集群分布式存储、黑马旅游实现过滤和搜索补全功能
ElasticSearch基础3——聚合、补全、集群。黑马旅游检索高亮+自定义分词器+自动补全+前后端消息同步
|
3月前
|
存储 监控 负载均衡
Elasticsearch 集群副本
【8月更文挑战第24天】
66 13
|
3月前
|
存储 负载均衡 监控
Elasticsearch 集群分片
【8月更文挑战第24天】
81 12
|
2月前
|
JSON 监控 Java
Elasticsearch 入门:搭建高性能搜索集群
【9月更文第2天】Elasticsearch 是一个分布式的、RESTful 风格的搜索和分析引擎,基于 Apache Lucene 构建。它能够处理大量的数据,提供快速的搜索响应。本教程将指导你如何从零开始搭建一个基本的 Elasticsearch 集群,并演示如何进行简单的索引和查询操作。
190 3