全面推进运维智能化分论坛回顾来啦 | 2023龙蜥操作系统大会

简介: 运维联盟的故障演练系统及运维联盟官网上线,欢迎登录测试。

2023 年 12 月 17 日,龙蜥操作系统大会在北京嘉瑞文化中心盛大开幕!12 月 18 日,以“智在创新,产学研联动”为主题的全面推进运维智能化分论坛(以下简称系统运维分论坛)也圆满举办。系统运维分论坛上,来自阿里云、中国信通院云大所、云观秋毫、清华大学、浪潮信息、中兴通讯、统信软件等企业的 10 位大咖在线解读 AI 在运维产品上的创新性和可行性。本次分论坛上隆重举行了系统运维联盟成员单位的授牌仪式。同时,重磅发布了运维联盟的故障演练系统及运维联盟官网。龙蜥社区系统运维联盟诚邀广大用户和运维行业的从业人员,一起贡献更多的故障 case 演练系统。龙蜥联盟链接:https://openanolis.cn/


(图/系统运维分论坛现场嘉宾合照)

龙蜥社区理事长、阿里云基础软件副总裁马涛作开场致辞。他表示,龙蜥社区系统运维联盟的成立,对于推进国内运维的标准化、智能化、体系化的发展,是一件非常重要的事情。同时,龙蜥对于联盟也有两个期望:一是期望通过此次分论坛,大家能够形成共识,达成合作,共同谋划面向未来更自动化、智能化的系统运维技术解决方案;二是期望通过信通院和阿里云对运维联盟的大力推进、中兴通讯等企业的重要参与,集合联盟各家成员智慧,提升中国整个运维行业的能力。

(图/龙蜥社区理事长、阿里云基础软件副总裁马涛)


中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力提出,云计算以及 AI 大模型时代的到来,给传统行业带来了重要变革,企业架构需要作出适应,运维人员也要进行自我转变以拥抱变化。信通院在系统运维领域,围绕各行业的痛点问题,做了许多行业指导标准工作,以及研究和探索工作;并期望未来能够在龙蜥把已有的工作成果和经验利用起来、结合标准化或国家政策方面,充分发挥国家自主、中立的角色作用,促进整个运维产业的发展。

(图/中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力)


本次系统运维分论坛上,中国信通院云大所副总工程师、龙蜥社区系统运维联盟委员会主席陈屹力阿里云系统服务负责人、龙蜥社区系统运维联盟委员会主席冯富秋出席并为系统运维联盟成员单位授牌,中兴通讯操作系统产品部副部长蒋学鑫和复旦大学计算机科学技术学院副院长彭鑫教授作为副主席单位对未来系统运维联盟的工作做了展望。蒋学鑫对于运维联盟的成立表示非常认可,并提出了三点看法:第一,系统运维是一片蓝海,它是产品中除了安全属性、功能属性之外的一种非常重要的可服务属性,因此运维联盟的成立具有非常重要的意义;第二,目前业界急需对运维产品,形成一些标准,并进行推广和落地;第三,系统运维是广大业界的痛点问题,通过此次运维联盟的成立,中兴通讯希望通过运维领域积累的经验和各产业专家一起,将运维行业做地更加标准化。彭鑫教授认为目前许多的系统以及技术已经无形中成为社会经济生活的重要基础设施,并对其稳定性提出了更高的要求,这使得运维变成了一件非常重要的事情。龙蜥社区成立运维联盟可以促进学术界和企业之间的交流合作,其运维演练系统作为基础设施对产品进行评估、评测,解决整个系统运维技术水平上已有、未来可预见的问题,结合学术界以及产业界,共同创造价值,为国家数字经济发展作出贡献。

(图/系统运维分论坛上系统运维联盟授牌仪式)


授牌仪式结束,来到了技术议题分享环节,也是联盟成员单位的“肌肉 show 场”开始了:云观秋毫 CEO 苌程带来了《开源模拟故障案例集系统,助力行业标准的建立》的主题分享。苌程在分享中提到国内运维所存在的问题,如同质化产品、定制化开发,并提出了通过开源故障案例集来解决这些问题。同时也详细介绍了基于云原生的故障案例集系统。

(图/云观秋毫 CEO 苌程)


信通院云大所高级业务主管、稳定性保障实验室负责人王海清分享了《中国信通院稳定性保障标准体系介绍》的主题演讲。王海清介绍了信通院关于稳定性保障体系的标准研究工作,从技术、管理和用户视角分析了稳定性保障的重要性和挑战,提出组织建设、流程机制和持续运营在稳定性保障中的重要作用,通过标准工作辅助企业建立稳定性保障体系和优化工作链条,提升运维效率与稳定性保障能力。

(图/信通院云大所高级业务主管、稳定性保障实验室负责人王海清)


龙蜥社区系统运维 SIG Contributer 刘馨蔚带来了《SysOM 的可观测和智能监控实践》的技术演讲。刘馨蔚分享中提到随着云原生的发展,给运维带来了极大挑战,并提到了现有运维产品的现状和不足,为了解决这些痛点,实现“零”运维,提出了两点解决方案,一是 SysOM 的应用观测方案,从应用视角主动观测、通过垂直往下的剖析,分析问题根因,针对 MySQL、应用调用关系追踪、Java 场景,详细介绍了观测方案;第二是针对大规模集群的智能监控方案,其中从容器角度、节点角度去评估集群的健康状态,并结合 AI 指标关联分析、智能化深度诊断,分析问题根因。

(图/龙蜥社区系统运维 SIG Contributer 刘馨蔚)


清华大学李亚慧带来《以网络为中心的应用感知技术研究》的主题分享。李亚慧介绍了云原生于维服务的运维现状,提出了以网络为中心进行应用感知的方式,且相比较于以应用为中心的感知方式,可以提升服务质量、安全性和故障处理能力。

(图/清华大学李亚慧)


浪潮信息的智能运维专家张鹏带来了《AI 驱动的服务器故障管理研究与实践》的主题分享。张鹏介绍了浪潮运维平台的服务器故障管理以及诊断能力,并针对服务器关键部件,如 CPU、内存,介绍了故障预测技术;同时展望智能化运维的未来发展,提出提高故障处理准确性和效率的目标。

(图/浪潮信息的智能运维专家张鹏)


阿里云的高级开发工程师杨易作了《ATP 应用诊断平台介绍》的主题演讲。杨易介绍了阿里云应用诊断分析平台的最佳事件,包括 Java 堆分析、日志分析、profiling 能力,并通过具体的案例介绍,展示了如何利用这些功能来解决线上问题。

(图/阿里云的高级开发工程师杨易)


中兴通讯操作系统运维团队负责人杨光在现场分享了《边缘轻量场景下系统运维的探索与实践》的主题演讲。杨光强调了运维能力在边缘设备领域的重要性,介绍了边缘设备的运维工具的特点、开发边缘设备运维工具的功能和应用场景,并计划在未来与 SysOM 进行对接,最终形成一些标准化的产出。

(图/中兴通讯操作系统运维团队负责人杨光)


统信软件的研发主管刘兴伟分享了《基于服务器操作系统的易维护性实践》的主题演讲。刘兴伟介绍了在操作系统运维实践中碰到的主要问题,如企业用户运维任务重、业务运维成本高,针对这些问题,介绍了易维护的解决方案、以及统信服务器运维管理平台功能,并强调龙蜥社区的优势,并介绍了后续与龙蜥社区的未来合作方式。

(图/统信软件的研发主管刘兴伟)


系统运维联盟为企业和用户搭起了一座桥梁,希望通过这个桥梁,让大家更细致地了解系统的故障表现、故障发现、故障解决提供了深入学习和交流的机会。联盟后续的运作,还得我们所有运维产业从业人员一起投入,才能走得更远。最后,感谢本论坛的各位嘉宾,所有联盟成员及执行出品人毛文安、周絮,运营支持金美琴、孙林林、蔡佳丽等,主持人刘馨蔚,工作人员:李光水、程书意、刘寅等的支持。


视频回放、课件获取:

2023 龙蜥操作系统大会直播回放及技术 PPT上线啦,欢迎点击下方链接观看~

回放链接:https://openanolis.cn/openanolisconference

技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。


—— 完 ——

Alibaba Cloud Linux 诚邀广大企业用户加入,首批招募 30 家伙伴单位,一起共建云上软件生态繁荣!

相关文章
|
3天前
|
机器学习/深度学习 人工智能 运维
智能化运维####
本文深入探讨了智能化运维的前沿趋势与实践,通过融合大数据、人工智能等先进技术,重塑传统IT运维模式。我们分析了智能化运维的核心价值,包括提升效率、减少故障响应时间及增强系统稳定性,并通过具体案例展示了其在现代企业中的应用成效。对于追求高效、智能运维管理的组织而言,本文提供了宝贵的洞见和策略指导。 ####
|
5天前
|
机器学习/深度学习 数据采集 人工智能
智能化运维在现代IT基础设施中的应用与价值####
本文探讨了智能化运维(AIOps)在现代IT基础设施管理中的实际应用、面临的挑战及其带来的深远影响。通过引入先进的算法和机器学习模型,智能化运维不仅提高了故障检测与响应的速度,还显著优化了资源配置,降低了运营成本,为企业数字化转型提供了强有力的技术支撑。 ####
|
3天前
|
机器学习/深度学习 人工智能 运维
智能运维在现代IT系统中的应用与挑战####
本文深入探讨了智能运维(AIOps)在现代IT系统中的关键作用,通过具体案例分析,揭示了其在提升系统稳定性、优化资源配置及自动化故障处理方面的显著优势。同时,文章也指出了实施智能运维过程中面临的数据安全、技术整合及人员技能转型等挑战,并提出了相应的解决策略,为读者提供了全面而深刻的见解。 ####
17 6
|
5天前
|
机器学习/深度学习 运维 监控
智能化运维:从被动响应到主动预防的转型之路####
本文深入探讨了智能化运维(AIOps)如何引领信息技术管理从传统的被动响应模式向主动预防机制转变,强调了大数据、人工智能算法与机器学习技术在提升系统稳定性和效率中的关键作用。通过分析智能化运维的核心价值、实施策略及面临的挑战,本文为读者揭示了一个更加智能、高效且灵活的IT运维未来蓝图。 ####
|
3天前
|
人工智能 运维 监控
智能运维在现代数据中心的应用与挑战
随着云计算和大数据技术的迅猛发展,现代数据中心的运维管理面临着前所未有的挑战。本文探讨了智能运维技术在数据中心中的应用,包括自动化监控、故障预测与诊断、资源优化等方面,并分析了当前面临的主要挑战,如数据安全、系统集成复杂性等。通过实际案例分析,展示了智能运维如何帮助数据中心提高效率、降低成本,并提出了未来发展趋势和建议。
|
3天前
|
机器学习/深度学习 数据采集 人工智能
运维新纪元:AIOps引领智能运维变革####
本文探讨了人工智能与运维管理深度融合的前沿趋势——AIOps(Artificial Intelligence for Operations),它通过机器学习、大数据分析等技术手段,为现代IT运维体系带来前所未有的智能化升级。不同于传统依赖人力的运维模式,AIOps能够实现故障预测、自动化修复、性能优化等功能,大幅提升系统稳定性和运营效率。文章将深入分析AIOps的核心价值、关键技术组件、实施路径以及面临的挑战,旨在为读者揭示这一新兴领域如何重塑运维行业的未来。 ####
|
8天前
|
机器学习/深度学习 人工智能 运维
智能化运维:从被动响应到主动预防####
【10月更文挑战第29天】 本文探讨智能化运维(AIOps)如何通过融合大数据、机器学习与自动化技术,推动IT运维管理从传统的被动响应模式向主动预防机制转变。不同于传统摘要概述全文内容的方式,本文摘要旨在直接揭示智能化运维的核心价值——利用智能算法预测潜在故障,减少系统停机时间,提升运维效率与服务质量,同时强调其在现代企业IT架构中的关键作用。 ####
39 9
|
2天前
|
机器学习/深度学习 数据采集 人工智能
智能运维:从自动化到AIOps的演进与实践####
本文探讨了智能运维(AIOps)的兴起背景、核心组件及其在现代IT运维中的应用。通过对比传统运维模式,阐述了AIOps如何利用机器学习、大数据分析等技术,实现故障预测、根因分析、自动化修复等功能,从而提升系统稳定性和运维效率。文章还深入分析了实施AIOps面临的挑战与解决方案,并展望了其未来发展趋势。 ####
|
8天前
|
机器学习/深度学习 人工智能 运维
智能化运维:从传统到AIOps的转型之路####
本文探讨了智能化运维(AIOps)的兴起背景、核心价值及其对现代IT运维模式的深刻影响。通过分析传统运维面临的挑战,阐述了AIOps如何利用大数据、机器学习技术实现故障预测、自动化处理与决策支持,进而提升运维效率和服务质量。文章还概述了实施AIOps的关键步骤与面临的主要挑战,为组织向智能化运维转型提供参考路径。 ####
|
6天前
|
机器学习/深度学习 运维 监控
智能运维在现代IT架构中的转型之路####
【10月更文挑战第29天】 本文旨在探讨智能运维(AIOps)如何成为现代IT架构不可或缺的一部分,通过分析其核心价值、关键技术及实践案例,揭示AIOps在提升系统稳定性、优化资源配置及加速故障响应中的关键作用。不同于传统运维模式的被动响应,智能运维强调预测性维护与自动化处理,为企业数字化转型提供强有力的技术支撑。 ####
31 0