CentOS7下部署滴滴云开源运维监控系统-Nightingale

本文涉及的产品
RDS MySQL DuckDB 分析主实例,基础系列 4核8GB
RDS AI 助手,专业版
RDS DuckDB + QuickBI 企业套餐,8核32GB + QuickBI 专业版
简介: CentOS7下部署滴滴云开源运维监控系统-Nightingale

640.jpg

夜莺(Nightingale)简介


Nightingale是滴滴基础平台联合滴滴云研发和开源的企业级监控解决方案。旨在满足云原生时代企业级的监控需求。


Nightingale在产品完成度、系统高可用、以及用户体验方面,达到了企业级的要求,可满足不同规模用户的场景,小到几台机器,大到数十万都可以完美支撑。兼顾云原生和裸金属,支持应用监控和系统监控,插件机制灵活,插件丰富完善,具有高度的灵活性和可扩展性。


Nightingale是一款分布式高性能的运维监控系统,在 Open-Falcon 的基础上,各核心模块做了大幅优化,引入了滴滴的生产实践经验结合滴滴内部的最佳实践,在性能、可维护性、易用性方面做了大量的改进, 作为集团统一的监控解决方案,支撑了滴滴内部数十亿监控指标,覆盖了从系统、容器、到应用等各层面的监控需求,周活跃用户数千。五年磨一剑,取之开源,回馈开源。夜莺Fork自Open-Falcon,可以把夜莺看做是Open-Falcon的下一代

640.png



特点与优势


1、可伸缩


对于快速发展的业务,一款可伸缩的监控系统是很有必要的。夜莺的每个模块都可以方便的水平扩展


2、高性能


得益于内存TSDB和RRD的归档机制,可以在秒级返回成百上千条监控指标,满足高性能监控大盘的需求


3、高可用


没有严重的单点故障,易于部署和运维。任一机器挂掉对集群无影响


4、可扩展


夜莺的客户端组件与falcon-agent兼容,内置了插件机制和日志监控机制


5、高效


夜莺集成了对象树(大厂标配),支持策略继承、多种告警函数,也支持告警回调用于故障自愈


6、易于部署


所有后端模块全部使用Go语言编写,减少了模块数量,大幅减小部署难度


下面介绍在CentOS7下部署夜莺Nightingale


为了方便起见,这里采用RPM包的方式安装

本文参考http://n9e.didiyun.com/zh/docs/install/


1、下载夜莺Nightingale的rpm包


下载地址https://dl.cactifans.com/n9e/1.3.0/


fd184979adb2237dba6f0e074fd35823.jpg

cd /opt
wget https://dl.cactifans.com/n9e/1.3.0/n9e-1.3.0-438ec4a.el7.x86_64.rpm-bundle.tar.gz
tar -zxf n9e-1.3.0-438ec4a.el7.x86_64.rpm-bundle.tar.gz


6f54d2af7a309e65032a5e3550714d0e.png

2、创建n9e用户并安装夜莺所有组件


useradd -U -m n9e
yum install n9e-*.rpm -y


f505fe5af181d6d7f3b5ba1d96d2acbd.png

e4b50bcd71d3c23d87c0035d5b709efb.png

3、配置yum源,安装MariaDB和nginx组件


curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
curl -o /etc/yum.repos.d/epel.repo http://mirrors.aliyun.com/repo/epel-7.repo
yum install mariadb-server nginx -y
systemctl enable mariadb.service
systemctl start mariadb.service
systemctl enable nginx.service
systemctl start nginx.service

640.png

640.png

4、导入n9e数据库表结构


mysqladmin -uroot password "n9epwd123"
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_hbs.sql
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_mon.sql
mysql -uroot -pn9epwd123 </usr/local/n9e/sql/n9e_uic.sql


为了安全考虑,建议为 n9e 独立建立 mysql 用户,在 mysql 里创建 n9e 用户并授权


create user n9e@localhost identified by 'n9epwd123';
grant all on n9e_hbs.* to n9e@localhost;
grant all on n9e_mon.* to n9e@localhost;
grant all on n9e_uic.* to n9e@localhost;

640.png

并修改组件/usr/local/n9e/etc/mysql.yml 文件里的数据库配置信息

640.png

5、替换默认nginx配置文件,并重启 nginx 服务


cd /etc/nginx/
mv nginx.conf nginx.conf_bak
cp /usr/local/n9e/etc/nginx.conf /etc/nginx/
systemctl restart nginx

640.png

6、启动所有组件


systemctl enable --now n9e-collector n9e-tsdb n9e-transfer n9e-monapi n9e-judge n9e-index

640.png

7、使用夜莺


使用浏览器打开http://ip 即可访问,默认账号 root 密码 root


640.png

节点管理(组织架构) 挂载endpoint到对应组织架构节点下

640.png

640.png

配置监控大盘

640.png640.png



监控大盘的定制做了大幅易用性改进,支持了图表阈值,支持了图表分类,新增图表和排序管理都是所见即所得的方式,巡检大盘的定制从此不再是困难


PS:模拟Linux服务器高cpu使用率,来测试告警功能


cat /dev/urandom | gzip -9 | gzip -d | gzip -9 | gzip -d > /dev/null


8、在endpoint安装采集客户端collector


wget https://dl.cactifans.com/n9e/1.3.0/n9e-collector-1.3.0-438ec4a.el7.x86_64.rpm
ll
rpm -ivh n9e-collector-1.3.0-438ec4a.el7.x86_64.rpm
cd /usr/local/n9e/etc/
cp address.yml address.yml_bak
vi address.yml
sed -i 's/127.0.0.1/192.168.31.80/g' address.yml
cat address.yml
systemctl enable --now n9e-collector
netstat -anp | grep 192.168.31.80


640.png

640.png

640.png

可以看到endpoint已经上线,可以自动挂载点对应的组织节点下

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。 &nbsp; 相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情:&nbsp;https://www.aliyun.com/product/rds/mysql&nbsp;
相关文章
|
9月前
|
存储 Ubuntu Linux
VMware-安装CentOS系统教程及安装包
虚拟机相当于是一个独立于你电脑的环境,在这个环境上面,你可以安装Linux、Windows、Ubuntu等各个类型各个版本的系统,在这个系统里面你不用担心有病读等,不用担心文件误删导致系统崩溃。 虚拟机也和正常的电脑系统是一样的,也可以开关机,不用的时候,你关机就可以了,也不会占用你的系统资源,使用起来还是比较方便 这里也有已经做好的CentOS 7系统,下载下来解压后直接用VMware打开就可以使用
1466 69
|
8月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
8月前
|
传感器 人工智能 运维
AR智慧运维系统介绍
阿法龙XR云平台是一款面向工业领域的增强现实(AR)智能化平台,助力企业实现数字化转型。平台集成智能巡检工作流、远程协助、AI视频验收、人脸识别等功能模块,支持AR眼镜与移动终端,提供虚实融合的运维体验。具备高度定制化能力,适配多种工业场景,提升运维效率与智能化水平。
|
9月前
|
数据采集 运维 监控
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
268 0
|
10月前
|
人工智能 运维 监控
聚焦“AI+运维”深度融合,龙蜥系统运维联盟 MeetUp 圆满结束
现场 40 多位开发者进行了深入的技术交流,探索 AI 与运维深度融合的未来路径。
|
9月前
|
Ubuntu Linux 索引
Centos 7、Debian及Ubuntu系统中安装和验证tree命令的指南。
通过上述步骤,我们可以在CentOS 7、Debian和Ubuntu系统中安装并验证 `tree`命令。在命令行界面中执行安装命令,然后通过版本检查确认安装成功。这保证了在多个平台上 `tree`命令的一致性和可用性,使得用户无论在哪种Linux发行版上都能使用此工具浏览目录结构。
765 78
|
10月前
|
缓存 NoSQL Linux
在CentOS 7系统中彻底移除MongoDB数据库的步骤
以上步骤完成后,MongoDB应该会从您的CentOS 7系统中被彻底移除。在执行上述操作前,请确保已经备份好所有重要数据以防丢失。这些步骤操作需要一些基本的Linux系统管理知识,若您对某一步骤不是非常清楚,请先进行必要的学习或咨询专业人士。在执行系统级操作时,推荐在实施前创建系统快照或备份,以便在出现问题时能够恢复到原先的状态。
1043 79
|
7月前
|
监控 关系型数据库 MySQL
在CentOS系统中,如何统计哪个进程打开了文件描述符?
利用上述方法,你可以有效地监控和统计CentOS系统中的进程打开的文件描述符数量,以帮助排查错误或优化系统配置。通过组合使用各种工具和命令,可以获得对系统状态和行为的深入了解,进而做出相应的调整和
328 5
|
9月前
|
运维 Dubbo Cloud Native
Dubbo 云原生重构出击:更快部署、更强控制台、更智能运维
Apache Dubbo 最新升级支持云原生,提供一键部署微服务集群与全新可视化控制台,提升全生命周期管理体验,助力企业高效构建云原生应用。
1138 25