二、 使用ELK的原因
日志主要包括系统日志、应用程序日志和安全日志。 系统运维和开发人员可以通过日志了解服务器软硬件信息、检查配置过程中的错误及错误发生的原因。经常分析日志可以了解服务器的负荷, 性能安全性, 从而及时采取措施纠正错误。
往往单台机器的日志我们使用grep、awk等工具就能基本实现简单分析,但是当日志被分散的储存不同的设备上。 如果你管理数十上百台服务器,你还在使用依次登录每台机器的传统方法查阅日志。这样是不是感觉很繁琐和效率低下。 当务之急我们使用集中化的日志管理, 例如∶ 开源的syslog,将所有服务器上的日志收集汇总。集中化管理日志后, 日志的统计和检索又成为一件比较麻烦的事情,一般我们使用grep、awk和wc等Linux命令能实现检索和统计,但是对于要求更高的查询、排序和统计等要求和庞大的机器数量依然使用这样的方法难免有点力不从心。
一般大型系统是一个分布式部署的架构,不同的服务模块部署在不同的服务器上,问题出现时, 大部分情况需要根据问题暴露的关键信息,定位到具体的服务器和服务模块,构建一套集中式日志系统, 可以提高定位问题的效率。
三、 完整日志系统基本特征
收集∶能够采集多种来源的日志数据
传输∶能够稳定的把日志数据解析过滤并传输到存储系统
存储∶存储日志数据
分析∶支持 UI分析
警告∶能够提供错误报告,监控机制
四、 ELK的工作原理
(1)在所有需要收集日志的服务器上部署Logstash; 或者先将日志进行集中化管理在日志服务器上, 在日志服务器上部署 Logs tash。
(2)Logstash 收集日志,将日志格式化并输出到 Elasticsearch 群集中。
(3)Elasticsearch 对格式化后的数据进行索引和存储。
(4)Kibana 从 ES 群集中查询数据生成图表,并进行前端数据的展示。
总结:logstash作为日志搜集器,从数据源采集数据,并对数据进行过滤,格式化处理,然后交由Elasticsearch存储,kibana对日志进行可视化处
五、部署ELK日志分析系统
本次实验部署小型架构
5.1 实验环境准备
生产环境中用的较多的版本6.7、7.2、7.4
安装的不同组件的版本号必须相同
服务器 | 节点/ip | 服务 |
node1节点(2C/4G) | node1/192.168.109.135 | Elasticsearch |
node1节点(2C/4G) | node2/192.168.109.137 | Elasticsearch |
Apache节点 | apache/192.168.109.138 | Logstash Kibana Apache |
hostnamectl set-hostname node01 su vim /etc/hosts 192.168.109.135 node01 192.168.109.137 node02 ping node02
设置Java环境
java -version #默认已经安装,如果没有安装,yum -y install java openjdk version "1.8.0_131" OpenJDK Runtime Environment (build 1.8.0_131-b12) OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)
5.2 部署 Elasticsearch 软件
两个节点
5.2.1 装elasticsearch—rpm包
#上传elasticsearch-6.7.2.rpm到/opt目录下 cd /opt rpm -ivh elasticsearch-6.7.2.rpm #传给节点2 scp elasticsearch-6.7.2.rpm node02:/opt
5.2.2 修改elasticsearch主配置文件
#备份配置文件 [root@node01 opt]# cd /etc/elasticsearch/ [root@node01 elasticsearch]# cp elasticsearch.yml{,.bak} [root@node01 elasticsearch]# ls elasticsearch.keystore jvm.options roles.yml elasticsearch.yml log4j2.properties users elasticsearch.yml.bak role_mapping.yml users_roles vim /etc/elasticsearch/elasticsearch.yml --17--取消注释,指定集群名字 cluster.name: my-elk-cluster --23--取消注释,指定节点名字:Node1节点为node1,Node2节点为node2 node.name: node01 node.master: true #是否master节点,false为否 node.data: true #是否数据节点,false为否 --33--取消注释,指定数据存放路径 path.data: /var/lib/elasticsearch --37--取消注释,指定日志存放路径 path.logs: /var/log/elasticsearch --43--取消注释,避免es使用swap交换分区,如果内存不够使用false bootstrap.memory_lock: true --55--取消注释,设置监听地址,0.0.0.0代表所有地址 network.host: 0.0.0.0 --59--取消注释,ES 服务的默认监听端口为9200 http.port: 9200 #指定es集群提供外部访问的接口 transport.tcp.port: 9300 #指定es集群内部通信接口 --68--取消注释,集群发现通过单播实现,指定要发现的节点 discovery.zen.ping.unicast.hosts: ["node01:9300", "node02:9300"] #过滤有效参数 [root@node01 elasticsearch]# grep -v "^#" /etc/elasticsearch/elasticsearch.yml cluster.name: my-elk-cluster node.name: node01 node.master: true node.data: true path.data: /var/lib/elasticsearch path.logs: /var/log/elasticsearch bootstrap.memory_lock: false network.host: 0.0.0.0 http.port: 9200 transport.tcp.port: 9300 discovery.zen.ping.unicast.hosts: ["node01:9300", "node02:9300"]
三类节点说明
master - 主节点
node.master: true node.data: false
data - 数据节点
node.master: false node.data: true
client - 客户端节点(不是必须)
node.master: false node.data: false
mixed- 混合节点(不建议,容易挂掉)
node.master: true node.data: true
5.2.3 es 性能调优参数
#优化最大内存大小和最大文件描述符的数量 vim /etc/security/limits.conf ...... * soft nofile 65536 #可打开的文件描述符的最大数(软限制) * hard nofile 131072 #可打开的文件描述符的最大数(硬限制) * soft memlock unlimited #单个用户可用的最大进程数量(软限制) * hard memlock unlimited #单个用户可用的最大进程数量(硬限制) #需重启永久生效 #临时生效 ulimit -n 131072 [root@node01 ~]# ulimit -a core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited scheduling priority (-e) 0 file size (blocks, -f) unlimited pending signals (-i) 14983 max locked memory (kbytes, -l) 64 max memory size (kbytes, -m) unlimited open files (-n) 131072 pipe size (512 bytes, -p) 8 POSIX message queues (bytes, -q) 819200 real-time priority (-r) 0 stack size (kbytes, -s) 8192 cpu time (seconds, -t) unlimited max user processes (-u) 14983 virtual memory (kbytes, -v) unlimited file locks (-x) unlimited #优化elasticsearch用户拥有的内存权限 由于ES构建基于lucene, 而lucene设计强大之处在于lucene能够很好的利用操作系统内存来缓存索引数据,以提供快速的查询性能。lucene的索引文件segements是存储在单文件中的,并且不可变,对于OS来说,能够很友好地将索引文件保持在cache中,以便快速访问;因此,我们很有必要将一半的物理内存留给lucene ; 另一半的物理内存留给ES(JVM heap )。所以, 在ES内存设置方面,可以遵循以下原则: 1.当机器内存小于64G时,遵循通用的原则,50%给ES,50%留给操作系统,供lucene使用 2.当机器内存大于64G时,遵循原则:建议分配给ES分配 4~32G 的内存即可,其它内存留给操作系统,供lucene使用 vim /etc/sysctl.conf #一个进程可以拥有的最大内存映射区域数,参考数据(分配 2g/262144,4g/4194304,8g/8388608) vm.max_map_count=262144 #加载 sysctl -p sysctl -a | grep vm.max_map_count
5.2.4 启动elasticsearch是否成功开启
#开启服务 [root@node01 ~]# systemctl start elasticsearch.service [root@node01 ~]# systemctl enable elasticsearch.service Created symlink from /etc/systemd/system/multi-user.target.wants/elasticsearch.service to /usr/lib/systemd/system/elasticsearch.service. #服务起来较慢,要等一会 [root@node01 ~]# netstat -natp |grep 9200 tcp6 0 0 :::9200 :::* LISTEN 11067/java
5.2.5 查看节点信息
浏览器访问192.168.109.135:9200,192.168.109.137:9200 查看节点 Node01、Node02 的信息。
浏览器访问 http://192.168.109.135:9200/_cluster/health?pretty 、 http://192.168.109.137:9200/_cluster/health?pretty查看群集的健康情况,可以看到 status 值为 green(绿色), 表示节点健康运行。
浏览器访问 http://192.168.109.135:9200/_cluster/state?pretty 检查群集状态信息。
5.2.6 安装 Elasticsearch-head 插件
使用上述方式查看群集的状态对用户并不友好,可以通过安装 Elasticsearch-head 插件,可以更方便地管理群集
Elasticsearch 在 5.0 版本后,Elasticsearch-head 插件需要作为独立服务进行安装,需要使用npm工具(NodeJS的包管理工具)安装。
安装 Elasticsearch-head 需要提前安装好依赖软件 node 和 phantomjs。
node:是一个基于 Chrome V8 引擎的 JavaScript 运行环境。
phantomjs:是一个基于 webkit 的JavaScriptAPI,可以理解为一个隐形的浏览器,任何基于 webkit 浏览器做的事情,它都可以做到。
5.2.6.1 编译安装 node
#上传软件包 node-v8.2.1.tar.gz 到/opt yum install gcc gcc-c++ make -y cd /opt tar zxvf node-v8.2.1.tar.gz cd node-v8.2.1/ ./configure make && make install
5.2.6.2 安装 phantomjs
#上传软件包 phantomjs-2.1.1-linux-x86_64.tar.bz2 到 cd /opt tar xvf phantomjs-2.1.1-linux-x86_64.tar.bz2 cd /opt/phantomjs-2.1.1-linux-x86_64/bin cp phantomjs /usr/local/bin
5.2.6.4 安装 Elasticsearch-head 数据可视化工具
#上传软件包 elasticsearch-head.tar.gz 到/opt cd /opt tar zxvf elasticsearch-head.tar.gz -C /usr/local/src/ cd /usr/local/src/elasticsearch-head/ npm install
5.2.6.5 修改 Elasticsearch 主配置文件
vim /etc/elasticsearch/elasticsearch.yml ...... --末尾添加以下内容-- http.cors.enabled: true #开启跨域访问支持,默认为 false http.cors.allow-origin: "*" #指定跨域访问允许的域名地址为所有 systemctl restart elasticsearch
5.2.6.6 启动 elasticsearch-head 服务
必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败
cd /usr/local/src/elasticsearch-head/ npm run start & > elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head > grunt server Running "connect:server" (connect) task Waiting forever... Started connect web server on http://localhost:9100 #elasticsearch-head 监听的端口是 9100 netstat -natp |grep 9100
通过 Elasticsearch-head 查看 Elasticsearch 信息
通过浏览器访问 http://192.168:109:135:9100地址并连接群集。如果看到群集健康值为 green 绿色,代表群集很健康。
插入索引
#通过命令插入一个测试索引,索引为 index-demo,类型为 test。 curl -X PUT 'localhost:9200/index-demo/test/1?pretty&pretty' -H 'content-Type: application/json' -d '{"user":"zhangsan","mesg":"hello world"}' //输出结果如下: { "_index" : "index-demo", "_type" : "test", "_id" : "1", "_version" : 1, "result" : "created", "_shards" : { "total" : 2, "successful" : 2, "failed" : 0 }, "created" : true }
浏览器访问 http://192.168.109.135:9100/ 查看索引信息,可以看见索引默认被分片5个,并且有一个副本。