全面推进运维智能化分论坛回顾来啦 | 2023龙蜥操作系统大会

简介: 运维联盟的故障演练系统及运维联盟官网上线,欢迎登录测试。

2023 年 12 月 17 日,龙蜥操作系统大会在北京嘉瑞文化中心盛大开幕!12 月 18 日,以“智在创新,产学研联动”为主题的全面推进运维智能化分论坛(以下简称系统运维分论坛)也圆满举办。系统运维分论坛上,来自阿里云、中国信通院云大所、云观秋毫、清华大学、浪潮信息、中兴通讯、统信软件等企业的 10 位大咖在线解读 AI 在运维产品上的创新性和可行性。本次分论坛上隆重举行了系统运维联盟成员单位的授牌仪式。同时,重磅发布了运维联盟的故障演练系统及运维联盟官网。龙蜥社区系统运维联盟诚邀广大用户和运维行业的从业人员,一起贡献更多的故障 case 演练系统。龙蜥联盟链接:https://openanolis.cn/


(图/系统运维分论坛现场嘉宾合照)

龙蜥社区理事长、阿里云基础软件副总裁马涛作开场致辞。他表示,龙蜥社区系统运维联盟的成立,对于推进国内运维的标准化、智能化、体系化的发展,是一件非常重要的事情。同时,龙蜥对于联盟也有两个期望:一是期望通过此次分论坛,大家能够形成共识,达成合作,共同谋划面向未来更自动化、智能化的系统运维技术解决方案;二是期望通过信通院和阿里云对运维联盟的大力推进、中兴通讯等企业的重要参与,集合联盟各家成员智慧,提升中国整个运维行业的能力。

(图/龙蜥社区理事长、阿里云基础软件副总裁马涛)


中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力提出,云计算以及 AI 大模型时代的到来,给传统行业带来了重要变革,企业架构需要作出适应,运维人员也要进行自我转变以拥抱变化。信通院在系统运维领域,围绕各行业的痛点问题,做了许多行业指导标准工作,以及研究和探索工作;并期望未来能够在龙蜥把已有的工作成果和经验利用起来、结合标准化或国家政策方面,充分发挥国家自主、中立的角色作用,促进整个运维产业的发展。

(图/中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力)


本次系统运维分论坛上,中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力阿里云系统服务负责人、龙蜥社区系统运维联盟委员会主席冯富秋出席并为系统运维联盟成员单位授牌,中兴通讯操作系统产品部副部长蒋学鑫和复旦大学计算机科学技术学院副院长彭鑫教授作为副主席单位对未来系统运维联盟的工作做了展望。蒋学鑫对于运维联盟的成立表示非常认可,并提出了三点看法:第一,系统运维是一片蓝海,它是产品中除了安全属性、功能属性之外的一种非常重要的可服务属性,因此运维联盟的成立具有非常重要的意义;第二,目前业界急需对运维产品,形成一些标准,并进行推广和落地;第三,系统运维是广大业界的痛点问题,通过此次运维联盟的成立,中兴通讯希望通过运维领域积累的经验和各产业专家一起,将运维行业做地更加标准化。彭鑫教授认为目前许多的系统以及技术已经无形中成为社会经济生活的重要基础设施,并对其稳定性提出了更高的要求,这使得运维变成了一件非常重要的事情。龙蜥社区成立运维联盟可以促进学术界和企业之间的交流合作,其运维演练系统作为基础设施对产品进行评估、评测,解决整个系统运维技术水平上已有、未来可预见的问题,结合学术界以及产业界,共同创造价值,为国家数字经济发展作出贡献。

(图/系统运维分论坛上系统运维联盟授牌仪式)


授牌仪式结束,来到了技术议题分享环节,也是联盟成员单位的“肌肉 show 场”开始了:云观秋毫 CEO 苌程带来了《开源模拟故障案例集系统,助力行业标准的建立》的主题分享。苌程在分享中提到国内运维所存在的问题,如同质化产品、定制化开发,并提出了通过开源故障案例集来解决这些问题。同时也详细介绍了基于云原生的故障案例集系统。

(图/云观秋毫 CEO 苌程)


信通院云大所高级业务主管、稳定性保障实验室负责人王海清分享了《中国信通院稳定性保障标准体系介绍》的主题演讲。王海清介绍了信通院关于稳定性保障体系的标准研究工作,从技术、管理和用户视角分析了稳定性保障的重要性和挑战,提出组织建设、流程机制和持续运营在稳定性保障中的重要作用,通过标准工作辅助企业建立稳定性保障体系和优化工作链条,提升运维效率与稳定性保障能力。

(图/信通院云大所高级业务主管、稳定性保障实验室负责人王海清)


龙蜥社区系统运维 SIG Contributer 刘馨蔚带来了《SysOM 的可观测和智能监控实践》的技术演讲。刘馨蔚分享中提到随着云原生的发展,给运维带来了极大挑战,并提到了现有运维产品的现状和不足,为了解决这些痛点,实现“零”运维,提出了两点解决方案,一是 SysOM 的应用观测方案,从应用视角主动观测、通过垂直往下的剖析,分析问题根因,针对 MySQL、应用调用关系追踪、Java 场景,详细介绍了观测方案;第二是针对大规模集群的智能监控方案,其中从容器角度、节点角度去评估集群的健康状态,并结合 AI 指标关联分析、智能化深度诊断,分析问题根因。

(图/龙蜥社区系统运维 SIG Contributer 刘馨蔚)


清华大学李亚慧带来《以网络为中心的应用感知技术研究》的主题分享。李亚慧介绍了云原生于维服务的运维现状,提出了以网络为中心进行应用感知的方式,且相比较于以应用为中心的感知方式,可以提升服务质量、安全性和故障处理能力。

(图/清华大学李亚慧)


浪潮信息的智能运维专家张鹏带来了《AI 驱动的服务器故障管理研究与实践》的主题分享。张鹏介绍了浪潮运维平台的服务器故障管理以及诊断能力,并针对服务器关键部件,如 CPU、内存,介绍了故障预测技术;同时展望智能化运维的未来发展,提出提高故障处理准确性和效率的目标。

(图/浪潮信息的智能运维专家张鹏)


阿里云的高级开发工程师杨易作了《ATP 应用诊断平台介绍》的主题演讲。杨易介绍了阿里云应用诊断分析平台的最佳事件,包括 Java 堆分析、日志分析、profiling 能力,并通过具体的案例介绍,展示了如何利用这些功能来解决线上问题。

(图/阿里云的高级开发工程师杨易)


中兴通讯操作系统运维团队负责人杨光在现场分享了《边缘轻量场景下系统运维的探索与实践》的主题演讲。杨光强调了运维能力在边缘设备领域的重要性,介绍了边缘设备的运维工具的特点、开发边缘设备运维工具的功能和应用场景,并计划在未来与 SysOM 进行对接,最终形成一些标准化的产出。

(图/中兴通讯操作系统运维团队负责人杨光)


统信软件的研发主管刘兴伟分享了《基于服务器操作系统的易维护性实践》的主题演讲。刘兴伟介绍了在操作系统运维实践中碰到的主要问题,如企业用户运维任务重、业务运维成本高,针对这些问题,介绍了易维护的解决方案、以及统信服务器运维管理平台功能,并强调龙蜥社区的优势,并介绍了后续与龙蜥社区的未来合作方式。

(图/统信软件的研发主管刘兴伟)


系统运维联盟为企业和用户搭起了一座桥梁,希望通过这个桥梁,让大家更细致地了解系统的故障表现、故障发现、故障解决提供了深入学习和交流的机会。联盟后续的运作,还得我们所有运维产业从业人员一起投入,才能走得更远。最后,感谢本论坛的各位嘉宾,所有联盟成员及执行出品人毛文安、周絮,运营支持金美琴、孙林林、蔡佳丽等,主持人刘馨蔚,工作人员:李光水、程书意、刘寅等的支持。


视频回放、课件获取:

2023 龙蜥操作系统大会直播回放及技术 PPT上线啦,欢迎点击下方链接观看~

回放链接:https://openanolis.cn/openanolisconference

技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。


—— 完 ——

Alibaba Cloud Linux 诚邀广大企业用户加入,首批招募 30 家伙伴单位,一起共建云上软件生态繁荣!

相关文章
|
17天前
|
机器学习/深度学习 人工智能 运维
人工智能在云计算中的运维优化:智能化的新时代
人工智能在云计算中的运维优化:智能化的新时代
112 49
|
5天前
|
人工智能 运维 架构师
开始报名,龙蜥社区系统运维联盟MeetUp暨iAutoBASE专题论坛来啦
12月27日,探讨车用基础软件技术及生态发展,欢迎报名。
开始报名,龙蜥社区系统运维联盟MeetUp暨iAutoBASE专题论坛来啦
|
11天前
|
存储 分布式计算 Hadoop
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
Dataphin V4.4版本引入了多项核心升级,包括级联发布、元数据采集扩展、数据源指标上架、自定义属性管理等功能,大幅提升数据处理与资产管理效率。此外,还支持Hadoop集群管理、跨Schema数据读取、实时集成目标端支持Hudi及MaxCompute delta等技术,进一步优化用户体验。
164 3
【产品升级】Dataphin V4.4重磅发布:开发运维提效、指标全生命周期管理、智能元数据生成再升级
|
2天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
32 13
|
8天前
|
机器学习/深度学习 数据采集 运维
机器学习在运维中的实时分析应用:新时代的智能运维
机器学习在运维中的实时分析应用:新时代的智能运维
47 12
|
19天前
|
人工智能 运维 自然语言处理
智能化运维:AI在IT运维领域的深度应用与实践####
本文探讨了人工智能(AI)技术在IT运维领域的深度融合与实践应用,通过分析AI驱动的自动化监控、故障预测与诊断、容量规划及智能决策支持等关键方面,揭示了AI如何赋能IT运维,提升效率、降低成本并增强系统稳定性。文章旨在为读者提供一个关于AI在现代IT运维中应用的全面视角,展示其实际价值与未来发展趋势。 ####
123 4
|
21天前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代IT系统中的应用与挑战####
本文探讨了智能化运维(AIOps)在现代IT系统中的关键作用及其面临的主要挑战。随着云计算、大数据和人工智能技术的飞速发展,传统的IT运维模式正逐渐向更加智能、自动化的方向转变。智能化运维通过集成机器学习算法、数据分析工具和自动化流程,显著提升了系统稳定性、故障响应速度和资源利用效率。然而,这一转型过程中也伴随着数据隐私、技术复杂性和人才短缺等问题。本文旨在为读者提供一个关于智能化运维的全面视角,分析其优势与挑战,并探讨未来的发展趋势。 ####
34 6
|
20天前
|
机器学习/深度学习 人工智能 运维
智能化运维:AI与大数据在IT运维中的应用探索####
本文旨在探讨人工智能(AI)与大数据分析技术如何革新传统IT运维模式,提升运维效率与服务质量。通过具体案例分析,揭示AI算法在故障预测、异常检测及自动化修复等方面的实际应用成效,同时阐述大数据如何助力实现精准运维管理,降低运营成本,提升用户体验。文章还将简要讨论实施智能化运维面临的挑战与未来发展趋势,为IT管理者提供决策参考。 ####
|
18天前
|
机器学习/深度学习 人工智能 运维
智能化运维在现代数据中心的应用与挑战####
本文深入探讨了智能化运维(AIOps)技术在现代数据中心管理中的实际应用,分析了其带来的效率提升、成本节约及潜在风险。通过具体案例,阐述了智能监控、自动化故障排查、容量规划等关键功能如何助力企业实现高效稳定的IT环境。同时,文章也指出了实施过程中面临的数据隐私、技术整合及人才短缺等挑战,并提出了相应的解决策略。 --- ####
37 1
|
21天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在企业IT管理中的应用与实践####
本文深入探讨了智能化运维(AIOps)的核心技术原理,通过对比传统运维模式,揭示了AIOps如何利用大数据、机器学习等先进技术提升故障预测准确性、优化资源分配及自动化处理流程。同时,文章详细阐述了智能化运维平台的实施步骤,包括数据收集与分析、模型训练与部署、以及持续监控与优化,旨在为企业IT部门提供一套切实可行的智能化转型路径。最后,通过几个典型应用案例,如某大型电商平台的智能告警系统和金融企业的自动化故障排查流程,直观展示了智能化运维在实际业务场景中的显著成效,强调了其在提升运维效率、降低运营成本方面的关键作用。 ####
42 4