2023 年 12 月 17 日,龙蜥操作系统大会在北京嘉瑞文化中心盛大开幕!12 月 18 日,以“智在创新,产学研联动”为主题的全面推进运维智能化分论坛(以下简称系统运维分论坛)也圆满举办。系统运维分论坛上,来自阿里云、中国信通院云大所、云观秋毫、清华大学、浪潮信息、中兴通讯、统信软件等企业的 10 位大咖在线解读 AI 在运维产品上的创新性和可行性。本次分论坛上隆重举行了系统运维联盟成员单位的授牌仪式。同时,重磅发布了运维联盟的故障演练系统及运维联盟官网。龙蜥社区系统运维联盟诚邀广大用户和运维行业的从业人员,一起贡献更多的故障 case 演练系统。龙蜥联盟链接:https://openanolis.cn/
(图/系统运维分论坛现场嘉宾合照)
龙蜥社区理事长、阿里云基础软件副总裁马涛作开场致辞。他表示,龙蜥社区系统运维联盟的成立,对于推进国内运维的标准化、智能化、体系化的发展,是一件非常重要的事情。同时,龙蜥对于联盟也有两个期望:一是期望通过此次分论坛,大家能够形成共识,达成合作,共同谋划面向未来更自动化、智能化的系统运维技术解决方案;二是期望通过信通院和阿里云对运维联盟的大力推进、中兴通讯等企业的重要参与,集合联盟各家成员智慧,提升中国整个运维行业的能力。
(图/龙蜥社区理事长、阿里云基础软件副总裁马涛)
中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力提出,云计算以及 AI 大模型时代的到来,给传统行业带来了重要变革,企业架构需要作出适应,运维人员也要进行自我转变以拥抱变化。信通院在系统运维领域,围绕各行业的痛点问题,做了许多行业指导标准工作,以及研究和探索工作;并期望未来能够在龙蜥把已有的工作成果和经验利用起来、结合标准化或国家政策方面,充分发挥国家自主、中立的角色作用,促进整个运维产业的发展。
(图/中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力)
本次系统运维分论坛上,中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力,阿里云系统服务负责人、龙蜥社区系统运维联盟委员会主席冯富秋出席并为系统运维联盟成员单位授牌,中兴通讯操作系统产品部副部长蒋学鑫和复旦大学计算机科学技术学院副院长彭鑫教授作为副主席单位对未来系统运维联盟的工作做了展望。蒋学鑫对于运维联盟的成立表示非常认可,并提出了三点看法:第一,系统运维是一片蓝海,它是产品中除了安全属性、功能属性之外的一种非常重要的可服务属性,因此运维联盟的成立具有非常重要的意义;第二,目前业界急需对运维产品,形成一些标准,并进行推广和落地;第三,系统运维是广大业界的痛点问题,通过此次运维联盟的成立,中兴通讯希望通过运维领域积累的经验和各产业专家一起,将运维行业做地更加标准化。彭鑫教授认为目前许多的系统以及技术已经无形中成为社会经济生活的重要基础设施,并对其稳定性提出了更高的要求,这使得运维变成了一件非常重要的事情。龙蜥社区成立运维联盟可以促进学术界和企业之间的交流合作,其运维演练系统作为基础设施对产品进行评估、评测,解决整个系统运维技术水平上已有、未来可预见的问题,结合学术界以及产业界,共同创造价值,为国家数字经济发展作出贡献。
(图/系统运维分论坛上系统运维联盟授牌仪式)
授牌仪式结束,来到了技术议题分享环节,也是联盟成员单位的“肌肉 show 场”开始了:云观秋毫 CEO 苌程带来了《开源模拟故障案例集系统,助力行业标准的建立》的主题分享。苌程在分享中提到国内运维所存在的问题,如同质化产品、定制化开发,并提出了通过开源故障案例集来解决这些问题。同时也详细介绍了基于云原生的故障案例集系统。
(图/云观秋毫 CEO 苌程)
信通院云大所高级业务主管、稳定性保障实验室负责人王海清分享了《中国信通院稳定性保障标准体系介绍》的主题演讲。王海清介绍了信通院关于稳定性保障体系的标准研究工作,从技术、管理和用户视角分析了稳定性保障的重要性和挑战,提出组织建设、流程机制和持续运营在稳定性保障中的重要作用,通过标准工作辅助企业建立稳定性保障体系和优化工作链条,提升运维效率与稳定性保障能力。
(图/信通院云大所高级业务主管、稳定性保障实验室负责人王海清)
龙蜥社区系统运维 SIG Contributer 刘馨蔚带来了《SysOM 的可观测和智能监控实践》的技术演讲。刘馨蔚分享中提到随着云原生的发展,给运维带来了极大挑战,并提到了现有运维产品的现状和不足,为了解决这些痛点,实现“零”运维,提出了两点解决方案,一是 SysOM 的应用观测方案,从应用视角主动观测、通过垂直往下的剖析,分析问题根因,针对 MySQL、应用调用关系追踪、Java 场景,详细介绍了观测方案;第二是针对大规模集群的智能监控方案,其中从容器角度、节点角度去评估集群的健康状态,并结合 AI 指标关联分析、智能化深度诊断,分析问题根因。
(图/龙蜥社区系统运维 SIG Contributer 刘馨蔚)
清华大学李亚慧带来《以网络为中心的应用感知技术研究》的主题分享。李亚慧介绍了云原生于维服务的运维现状,提出了以网络为中心进行应用感知的方式,且相比较于以应用为中心的感知方式,可以提升服务质量、安全性和故障处理能力。
(图/清华大学李亚慧)
浪潮信息的智能运维专家张鹏带来了《AI 驱动的服务器故障管理研究与实践》的主题分享。张鹏介绍了浪潮运维平台的服务器故障管理以及诊断能力,并针对服务器关键部件,如 CPU、内存,介绍了故障预测技术;同时展望智能化运维的未来发展,提出提高故障处理准确性和效率的目标。
(图/浪潮信息的智能运维专家张鹏)
阿里云的高级开发工程师杨易作了《ATP 应用诊断平台介绍》的主题演讲。杨易介绍了阿里云应用诊断分析平台的最佳事件,包括 Java 堆分析、日志分析、profiling 能力,并通过具体的案例介绍,展示了如何利用这些功能来解决线上问题。
(图/阿里云的高级开发工程师杨易)
中兴通讯操作系统运维团队负责人杨光在现场分享了《边缘轻量场景下系统运维的探索与实践》的主题演讲。杨光强调了运维能力在边缘设备领域的重要性,介绍了边缘设备的运维工具的特点、开发边缘设备运维工具的功能和应用场景,并计划在未来与 SysOM 进行对接,最终形成一些标准化的产出。
(图/中兴通讯操作系统运维团队负责人杨光)
统信软件的研发主管刘兴伟分享了《基于服务器操作系统的易维护性实践》的主题演讲。刘兴伟介绍了在操作系统运维实践中碰到的主要问题,如企业用户运维任务重、业务运维成本高,针对这些问题,介绍了易维护的解决方案、以及统信服务器运维管理平台功能,并强调龙蜥社区的优势,并介绍了后续与龙蜥社区的未来合作方式。
(图/统信软件的研发主管刘兴伟)
系统运维联盟为企业和用户搭起了一座桥梁,希望通过这个桥梁,让大家更细致地了解系统的故障表现、故障发现、故障解决提供了深入学习和交流的机会。联盟后续的运作,还得我们所有运维产业从业人员一起投入,才能走得更远。最后,感谢本论坛的各位嘉宾,所有联盟成员及执行出品人毛文安、周絮,运营支持金美琴、孙林林、蔡佳丽等,主持人刘馨蔚,工作人员:李光水、程书意、刘寅等的支持。
视频回放、课件获取:
2023 龙蜥操作系统大会直播回放及技术 PPT上线啦,欢迎点击下方链接观看~
回放链接:https://openanolis.cn/openanolisconference
技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。
—— 完 ——
Alibaba Cloud Linux 诚邀广大企业用户加入,首批招募 30 家伙伴单位,一起共建云上软件生态繁荣!