CentOS7下部署滴滴云开源运维监控系统-Nightingale

本文涉及的产品
云数据库 RDS MySQL,集群系列 2核4GB
推荐场景:
搭建个人博客
RDS MySQL Serverless 基础系列,0.5-2RCU 50GB
RDS MySQL Serverless 高可用系列,价值2615元额度,1个月
简介: CentOS7下部署滴滴云开源运维监控系统-Nightingale

640.jpg

夜莺(Nightingale)简介


Nightingale是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。


Nightingale在产品完成度、系统高可用、以及用户体验方面,达到了企业级的要求,可满足不同规模用户的场景,小到几台机器,大到数十万都可以完美支撑。兼顾云原生和裸金属,支持应用监控和系统监控,插件机制灵活,插件丰富完善,具有高度的灵活性和可扩展性。


Nightingale是一款分布式高性能的运维监控系统,在 Open-Falcon 的基础上,各核心模块做了大幅优化,引入了滴滴的生产实践经验结合滴滴内部的最佳实践,在性能、可维护性、易用性方面做了大量的改进, 作为集团统一的监控解决方案,支撑了滴滴内部数十亿监控指标,覆盖了从系统、容器、到应用等各层面的监控需求,周活跃用户数千。五年磨一剑,取之开源,回馈开源。夜莺Fork自Open-Falcon,可以把夜莺看做是Open-Falcon的下一代

640.png



特点与优势


1、可伸缩


对于快速发展的业务,一款可伸缩的监控系统是很有必要的。夜莺的每个模块都可以方便的水平扩展


2、高性能


得益于内存TSDB和RRD的归档机制,可以在秒级返回成百上千条监控指标,满足高性能监控大盘的需求


3、高可用


没有严重的单点故障,易于部署和运维。任一机器挂掉对集群无影响


4、可扩展


夜莺的客户端组件与falcon-agent兼容,内置了插件机制和日志监控机制


5、高效


夜莺集成了对象树(大厂标配),支持策略继承、多种告警函数,也支持告警回调用于故障自愈


6、易于部署


所有后端模块全部使用Go语言编写,减少了模块数量,大幅减小部署难度


下面介绍在CentOS7下部署夜莺Nightingale


为了方便起见,这里采用RPM包的方式安装

本文参考http://n9e.didiyun.com/zh/docs/install/


1、下载夜莺Nightingale的rpm包


下载地址https://dl.cactifans.com/n9e/1.3.0/


fd184979adb2237dba6f0e074fd35823.jpg

cd /opt
wget https://dl.cactifans.com/n9e/1.3.0/n9e-1.3.0-438ec4a.el7.x86_64.rpm-bundle.tar.gz
tar -zxf n9e-1.3.0-438ec4a.el7.x86_64.rpm-bundle.tar.gz


6f54d2af7a309e65032a5e3550714d0e.png

2、创建n9e用户并安装夜莺所有组件


useradd -U -m n9e
yum install n9e-*.rpm -y


f505fe5af181d6d7f3b5ba1d96d2acbd.png

e4b50bcd71d3c23d87c0035d5b709efb.png

3、配置yum源,安装MariaDB和nginx组件


curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
yum install mariadb-server nginx -y
systemctl enable mariadb.service
systemctl start mariadb.service
systemctl enable nginx.service
systemctl start nginx.service

640.png

640.png

4、导入n9e数据库表结构


mysqladmin -uroot password "n9epwd123"
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_hbs.sql
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_mon.sql
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_uic.sql


为了安全考虑,建议为 n9e 独立建立 mysql 用户,在 mysql 里创建 n9e 用户并授权


create user n9e@localhost identified by 'n9epwd123';
grant all on n9e_hbs.* to n9e@localhost;
grant all on n9e_mon.* to n9e@localhost;
grant all on n9e_uic.* to n9e@localhost;

640.png

并修改组件/usr/local/n9e/etc/mysql.yml 文件里的数据库配置信息

640.png

5、替换默认nginx配置文件,并重启 nginx 服务


cd /etc/nginx/
mv nginx.conf nginx.conf_bak
cp /usr/local/n9e/etc/nginx.conf /etc/nginx/
systemctl restart nginx

640.png

6、启动所有组件


systemctl enable --now n9e-collector n9e-tsdb n9e-transfer n9e-monapi n9e-judge n9e-index

640.png

7、使用夜莺


使用浏览器打开http://ip 即可访问,默认账号 root 密码 root


640.png

节点管理(组织架构) 挂载endpoint到对应组织架构节点下

640.png

640.png

配置监控大盘

640.png640.png



监控大盘的定制做了大幅易用性改进,支持了图表阈值,支持了图表分类,新增图表和排序管理都是所见即所得的方式,巡检大盘的定制从此不再是困难


PS:模拟Linux服务器高cpu使用率,来测试告警功能


cat /dev/urandom | gzip -9 | gzip -d | gzip -9 | gzip -d > /dev/null


8、在endpoint安装采集客户端collector


wget https://dl.cactifans.com/n9e/1.3.0/n9e-collector-1.3.0-438ec4a.el7.x86_64.rpm
ll
rpm -ivh n9e-collector-1.3.0-438ec4a.el7.x86_64.rpm
cd /usr/local/n9e/etc/
cp address.yml address.yml_bak
vi address.yml
sed -i 's/127.0.0.1/192.168.31.80/g' address.yml
cat address.yml
systemctl enable --now n9e-collector
netstat -anp | grep 192.168.31.80


640.png

640.png

640.png

可以看到endpoint已经上线,可以自动挂载点对应的组织节点下

相关实践学习
如何在云端创建MySQL数据库
开始实验后,系统会自动创建一台自建MySQL的 源数据库 ECS 实例和一台 目标数据库 RDS。
全面了解阿里云能为你做什么
阿里云在全球各地部署高效节能的绿色数据中心,利用清洁计算为万物互联的新世界提供源源不断的能源动力,目前开服的区域包括中国(华北、华东、华南、香港)、新加坡、美国(美东、美西)、欧洲、中东、澳大利亚、日本。目前阿里云的产品涵盖弹性计算、数据库、存储与CDN、分析与搜索、云通信、网络、管理与监控、应用服务、互联网中间件、移动服务、视频服务等。通过本课程,来了解阿里云能够为你的业务带来哪些帮助 &nbsp; &nbsp; 相关的阿里云产品:云服务器ECS 云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。产品详情: https://www.aliyun.com/product/ecs
相关文章
|
21天前
|
Web App开发 搜索推荐 Unix
Linux系统之MobaXterm远程连接centos的GNOME桌面环境
【10月更文挑战第21天】Linux系统之MobaXterm远程连接centos的GNOME桌面环境
169 4
Linux系统之MobaXterm远程连接centos的GNOME桌面环境
|
10天前
|
Linux 开发工具 Windows
CentOS8 64位系统 搭建内网穿透frp
【10月更文挑战第23天】本文介绍了如何在Linux系统上搭建frp内网穿透服务,并配置Windows客户端进行访问。首先,通过系统信息检查和软件下载,完成frp服务端的安装与配置。接着,在Windows客户端下载并配置frpc,实现通过域名访问内网地址。最后,通过创建systemd服务,实现frp服务的开机自动启动。
46 14
|
7天前
|
缓存 运维 监控
【运维必备知识】Linux系统平均负载与top、uptime命令详解
系统平均负载是衡量Linux服务器性能的关键指标之一。通过使用 `top`和 `uptime`命令,可以实时监控系统的负载情况,帮助运维人员及时发现并解决潜在问题。理解这些工具的输出和意义是确保系统稳定运行的基础。希望本文对Linux系统平均负载及相关命令的详细解析能帮助您更好地进行系统运维和性能优化。
25 3
|
11天前
|
存储 Linux Docker
centos系统清理docker日志文件
通过以上方法,可以有效清理和管理CentOS系统中的Docker日志文件,防止日志文件占用过多磁盘空间。选择合适的方法取决于具体的应用场景和需求,可以结合手动清理、logrotate和调整日志驱动等多种方式,确保系统的高效运行。
12 2
|
15天前
|
运维 监控 中间件
数据中心运维监控系统产品价值与优势
华汇数据运维监控系统面向IT基础架构及IT支撑平台的监控和运维管理,包含监测、分析、展现和告警。监控范围涵盖了网络设备、主机系统、数据库、中间件和应用软件等。
40 4
|
29天前
|
运维 监控 安全
高效运维管理:提升系统稳定性的策略与实践
【10月更文挑战第13天】 本文探讨了高效运维管理的关键策略和实践,旨在帮助运维团队提升系统的稳定性。通过分析常见问题,提出具体的解决方案,包括监控与告警、自动化工具的应用、故障排查与恢复、性能优化以及安全防护等方面。通过这些策略和实践,可以帮助企业构建一个稳定、可靠且高效的IT系统。
72 1
|
10天前
|
运维 监控 网络协议
自动化运维的魔法——打造高效、可靠的系统
【10月更文挑战第32天】在数字化时代的浪潮下,运维不再是简单的硬件维护和故障排除。它已经演变成一场关乎效率、稳定性和创新的技术革命。自动化运维,作为这场革命的核心,正引领着企业走向更加智能和高效的未来。本文将带你探索自动化运维的世界,揭示其背后的原理和实践,让你领略到自动化带来的无限可能。
18 0
|
Linux
百度搜索:蓝易云 ,Centos7系统wget 的安装与使用详细教程。
以上是在CentOS 7系统上安装和使用wget的详细教程。确保按照步骤操作,并根据您的需求进行必要的修改和调整。
182 0
|
关系型数据库 MySQL Linux
百度搜索:蓝易云【Centos7系统如何安装MySQL5.7数据库?】
安装 MySQL 5.7 数据库需要进行以下步骤:
119 0
|
6月前
|
关系型数据库 Linux Shell
Centos系统上安装PostgreSQL和常用PostgreSQL功能
Centos系统上安装PostgreSQL和常用PostgreSQL功能