龙蜥社区正式开源 SysOM,打造一站式系统运维

简介: SysOM 是由龙蜥社区系统运维 SIG 打造的一站式操作系统运维平台,能够帮助用户在统一平台上实现主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。

一站式系统运维平台 SysOM 正式发布并开源

InfoQ 获悉,近日,龙蜥社区一站式系统运维平台 System Operation & Maintenance(以下简称“SysOM”)正式发布,并已开源。

据介绍,SysOM 由龙蜥社区系统运维 SIG 组打造,融入了 SIG 组成员多年运维实践经验,通过统一的前端 Web 将所有运维服务的分析数据展示给用户,用户可以在同一个平台上进行主机管理、系统监控、异常诊断、日志审计、安全管控等复杂操作系统管理。值得一提的是,前端采用了开源的深度诊断解决方案 SysAK,该解决方案沉淀了百万级服务器的运维经验。

SysOM 可以解决哪些问题?

当前,Linux 社区存在大量的运维管理、系统监控、诊断工具,碎片化严重。单个工具解决单个场景问题,需要用户花费大量时间研究该工具才能使用,没有统一的平台为用户提供好的操作系统运维体验。

与此同时,操作系统作为非常底层的基础设施,运维难度大,系统宕机、内存及网络等问题专业性强,需要专业的操作系统知识,对于一般运维人员入门门槛过高。

此外,一般的开源操作系统都有提供软件安全更新,但是却没有运维平台来统一管理安全漏洞的影响范围,漏洞的发现及修复。

在此背景下,SysOM 平台应运而生,它集运维、监控、诊断为一体,能让系统的健康状况一目了然。据介绍,SysOM 当前提供以下 4 方面能力:

  • 统一平台:一个平台解决操作系统运维过程中所需要的多种关键能力。SysOM 将主机管理、监控、诊断、审计、修复、安全能力集于一体,通过 Web 化的界面管理方式,用户可以轻松运维所有机器;
  • 简单易用:提供统一监控系统,用户无需配置即可多维度的观测到所管理主机的状态;提供统一的诊断系统,用户用过 Web 化的界面即可完整各类深入的操作系统问题诊断;
  • 深度分析:集成 SysAK 工具集深度诊断解决方案,沉淀百万级的运维经验,进行内核源码级别的问题剖析;
  • 安全可靠:提供统一的安全中心,为用户所管理主机提供全方位的漏洞监控、管理、修复,保障系统的安全性;同时提供各类安全加固能力,满足不同应用不同程度的安全要求。

目前,SysOM 的后续功能还在开发中。

SysOM 架构介绍

SysOM 整体架构分为前端展示、服务端分析、客户数据收集。

通过统一的前端 Web 将所有运维服务的分析数据展示给用户:

image.png

SysOM 使用实践

1、环境准备

操作系统:Anolis OS 8.4 ANCK 64 位

系统规格:2 核 8 g

数量:3 台

网络:公网 IP

2、SysOM 部署

2.1 监控组件部署

选择 Server 节点,执行下述命令部署监控组件

部署目录

mkdir -p /usr/local/sysom/server/monitor/

下载 grafana + prometheus + node-exporter

下载 grafana 到 /usr/local/sysom/server/monitor/

wget https ://dl.grafana.com/oss/release/grafana-8.2.5-1.x86_64.rpm -P /usr/local/sysom/server/monitor/

下载 prometheus 到 /usr/local/sysom/server/monitor/

wget https ://github.com/prometheus/prometheus/releases/download/v2.29.1/prometheus-2.29.1.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

下载 node-exporter 到 /usr/local/sysom/server/monitor/

wget https ://github.com/prometheus/node_exporter/releases/download/v1.2.2/node_exporter-1.2.2.linux-amd64.tar.gz -P /usr/local/sysom/server/monitor/

2.2 诊断组件部署

在 Client 节点,执行下述命令部署监控组件

如未安装诊断组件,SysOM 的诊断中心将无法运行

部署目录

mkdir -p /usr/local/sysom/server/diagnose

下载诊断组件 sysAK

wget https ://gitee.com/anolis/sysak/attach_files/1011048/download/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm -P /usr/local/sysom/server/diagnose/

安装 sysAK

rpm -idv /usr/local/sysom/server/diagnose/sysak-4.19.91-24.8-1.2.1-1.an8.x86_64.rpm --nodeps

2.3 SysOM 部署

下载 SysOM

wget https ://gitee.com/anolis/sysom/attach_files/1010533/download/sysomRelease-20220329115704.tar.gz -P /usr/local/sysom/

cd /usr/local/sysom/

tar -zxvf sysomRelease-20220329115704.tar.gz

cd sysomRelease-20220329115704

安装 Sysom。选择前面准备好的机器中的一台作为 SysOM 服务器,如果只有公网 IP,只需要填一样即可(暂不支持离线安装)。

./deploy.sh /usr/local/sysom 内网 IP 公网 IP

3、使用 SysOM

部署成功后,用户就可以通过浏览器访问已部署的 SysOM 平台了。直接在浏览器中输入公网 IP(如果只有内网 IP 也可以用内网 IP)。

目录
相关文章
|
3月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
3月前
|
传感器 人工智能 运维
AR智慧运维系统介绍
阿法龙XR云平台是一款面向工业领域的增强现实(AR)智能化平台,助力企业实现数字化转型。平台集成智能巡检工作流、远程协助、AI视频验收、人脸识别等功能模块,支持AR眼镜与移动终端,提供虚实融合的运维体验。具备高度定制化能力,适配多种工业场景,提升运维效率与智能化水平。
|
5月前
|
运维 Prometheus 监控
别再盲选了!开源运维工具选型这事儿,咱得说人话
别再盲选了!开源运维工具选型这事儿,咱得说人话
361 7
|
4月前
|
数据采集 运维 监控
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
运维靠经验拍脑袋?不如上车:构建“数据驱动”的智能决策系统
205 0
|
5月前
|
人工智能 运维 监控
聚焦“AI+运维”深度融合,龙蜥系统运维联盟 MeetUp 圆满结束
现场 40 多位开发者进行了深入的技术交流,探索 AI 与运维深度融合的未来路径。
|
6月前
|
人工智能 运维 安全
基于合合信息开源智能终端工具—Chaterm的实战指南【当运维遇上AI,一场效率革命正在发生】
在云计算和多平台运维日益复杂的今天,传统命令行工具正面临前所未有的挑战。工程师不仅要记忆成百上千条操作命令,还需在不同平台之间切换终端、脚本、权限和语法,操作效率与安全性常常难以兼顾。尤其在多云环境、远程办公、跨部门协作频繁的背景下,这些“低效、碎片化、易出错”的传统运维方式,已经严重阻碍了 IT 团队的创新能力和响应速度。 而就在这时,一款由合合信息推出的新型智能终端工具——Chaterm,正在悄然颠覆这一现状。它不仅是一款跨平台终端工具,更是业内率先引入 AI Agent 能力 的“会思考”的云资源管理助手。
|
6月前
|
人工智能 运维 Prometheus
别等系统“炸了”才慌!聊聊AI搞运维故障检测的那些真香时刻
别等系统“炸了”才慌!聊聊AI搞运维故障检测的那些真香时刻
308 0
|
8月前
|
人工智能 运维 关系型数据库
|
4月前
|
人工智能 运维 Prometheus
运维还要天天盯人值班?现代化运维就该让系统自己跑!
运维还要天天盯人值班?现代化运维就该让系统自己跑!
152 4