GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

简介: GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

首图-图标.png


【阅读原文】戳:GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享



10月28日-29日,第十八届GOPS全球运维大会GOPS 2022在上海顺利召开。作为国内规模最大的高端运维盛会之一,大会涵盖了DevOps、AIOps、DevSecOps、云原生、效能度量等多个技术领域,此外还特设了自动化运维、云原生及DevOps 实践等特色专场。阿里云基础设施网络团队资深技术专家林涛受邀分享阿里云基础设施网络在自动化运维体系方面的落地实践


B4B749E6-3FBC-4042-B364-9E0521A50CE3.png

GOPS全球运维大会由高效运维社区(GreatOPS)、开放运维联盟(OOPSA)和 DevOps时代社区联合主办,是国内第一个面向互联网、金融、通信及传统行业广大运维技术人员的运维行业大会,旨在传播先进技术思想和理念,分享业内最佳实践。


全球运维大会 林涛1.jpg

图|阿里云基础设施网络团队资深技术专家林涛分享阿里云基础设施网络在自动化运维体系方面的落地实践


林涛回顾了阿里巴巴网络基础设施的超大规模发展历史。阿里云网络基础设施设备规模数的飞速增长使得网络架构异常复杂,同时给系统的稳定性等带来了很大挑战。面对诸多运维困难,阿里云基础设施网络自动化团队自主研发了覆盖网络运维全生命周期的网络自动化运维系统,涵盖资产管理、网络架构规划、交付、变更、监控、运营等主要能力,通过制定完善的运维体系并沉淀成系统能力,极大地提高了基础设施网络的稳定性。


林涛在分享中还强调:网络自动运维体系搭建带来的不仅是系统稳定性的提高,通过系统来实现自动化运维、智能运维,还能极大地提高运维效率。阿里巴巴基础设施在规模化增长的过程中,网络自动化团队人员的投入并没有同步增加,为公司带来了非常好的降本提效效益。在实际运维工作中,运维同学还能将自己的运维经验沉淀成系统的标准运维方案,极大地提高了整个团队的运维水准和效率。


运维大会.jpg


历经打磨,阿里云基础设施网络团队已成功将积累多年建设成熟的网络自动化运维系统产品化输出到阿里云平台,形成了标准的商业化产品——云网管CMN。产品面向所有公共云、专有云等客户开放,适用于数据中心运维、办公网运维、连锁分支门店网络运维、场馆展会网络运维等业务场景。


阿里云“云网管”产品主要包括设备资产管理、网络建设规划、设备监控告警、SYSLOG日志、流量分析、网络拓扑可视化、网络自动化、巡检等主要能力,在不通厂商、不同型号设备纳管方面具有独特优势,支持市面上主流厂家服务器、网络设备、防火墙、无线AP、IOT终端等的统一管理监控运维。产品开箱即用,安装探针后可自动发现网络中设备并一键纳入管理,功能操作简单方便易用,产品功能提供API可方便与第三方业务系统集成。


当前大型企业IT架构复杂,在本地建有数据中心的同时,可能也在同时使用各类公共云厂商的服务。阿里云“云网管”除了能对客户自建数据中心进行管理外,还能统一监管各类公共云上资源,为客户提供多云与线下数据中心的统一融合监管控运维方案。


展望未来,阿里云基础设施网络团队将结合自身优势,携手业内硬件生态厂商伙伴,持续加强产品异构设备、云上资源统一监管控能力,聚焦智能化运维体系标准建设及产品化,为推动IT基础设施朝智能化方向演进不断贡献力量!



点击 此处 了解更多“阿里云云网管”产品



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
7月前
|
数据采集 运维 数据可视化
AR 运维系统与 MES、EMA、IoT 系统的融合架构与实践
AR运维系统融合IoT、EMA、MES数据,构建“感知-分析-决策-执行”闭环。通过AR终端实现设备数据可视化,实时呈现温度、工单等信息,提升运维效率与生产可靠性。(238字)
|
7月前
|
弹性计算 Devops Shell
用阿里云 DevOps Flow 实现 ECS 部署自动化:从准备到落地的完整指南
阿里云 DevOps Flow 是一款助力开发者实现自动化部署的高效工具,支持代码流水线构建、测试与部署至ECS实例,显著提升交付效率与稳定性。本文详解如何通过 Flow 自动部署 Bash 脚本至 ECS,涵盖环境准备、流水线搭建、源码接入、部署流程设计及结果验证,助你快速上手云上自动化运维。
613 0
|
8月前
|
存储 运维 安全
运维知识沉淀工具深度解析:从结构设计到落地实践全拆解
运维知识沉淀工具助力团队将零散经验结构化存储,实现问题处理路径标准化、知识复用化。通过标签、模板与自动化调取机制,让每次处理都留下可复用资产,提升团队协同效率与系统稳定性。
|
11月前
|
数据采集 机器学习/深度学习 人工智能
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
运维人的“福音”?AI 驱动的自动化网络监控到底香不香!
1189 0
|
7月前
|
机器学习/深度学习 人工智能 运维
三重Reward驱动的运维智能体进化:多智能体、上下文工程与强化学习的融合实践
这篇文章系统性地阐述了 AI 原生时代下,面向技术风险领域的智能体系统(DeRisk)的架构设计、核心理念、关键技术演进路径与实践落地案例。
三重Reward驱动的运维智能体进化:多智能体、上下文工程与强化学习的融合实践
|
数据采集 机器学习/深度学习 人工智能
智能运维在IT管理中的实践与探索
【10月更文挑战第21天】 本文深入探讨了智能运维(AIOps)技术在现代IT管理中的应用,通过分析其核心组件、实施策略及面临的挑战,揭示了智能运维如何助力企业实现自动化监控、故障预测与快速响应,从而提升整体运维效率与系统稳定性。文章还结合具体案例,展示了智能运维在实际环境中的显著成效。
613 133
|
9月前
|
运维 监控 负载均衡
高效运维实践:常见问题的应对策略与实践经验
本文探讨了运维工作中的五大核心挑战及应对策略,涵盖负载均衡优化、数据库性能提升、系统监控预警、容器化与微服务运维等方面,旨在帮助企业提升系统稳定性与运维效率。
|
9月前
|
运维 监控 安全
从实践到自动化:现代运维管理的转型与挑战
本文探讨了现代运维管理从传统人工模式向自动化转型的必要性与路径,分析了传统运维的痛点,如效率低、响应慢、依赖经验等问题,并介绍了自动化运维在提升效率、降低成本、增强系统稳定性与安全性方面的优势。结合技术工具与实践案例,文章展示了企业如何通过自动化实现运维升级,推动数字化转型,提升业务竞争力。
|
12月前
|
人工智能 运维 监控
阿里云携手神州灵云打造云内网络性能监测标杆 斩获中国信通院高质量数字化转型十大案例——金保信“云内网络可观测”方案树立云原生运维新范式
2025年,金保信社保卡有限公司联合阿里云与神州灵云申报的《云内网络性能可观测解决方案》入选高质量数字化转型典型案例。该方案基于阿里云飞天企业版,融合云原生引流技术和流量“染色”专利,解决云内运维难题,实现主动预警和精准观测,将故障排查时间从数小时缩短至15分钟,助力企业降本增效,形成可跨行业复制的数字化转型方法论。
624 6
|
机器学习/深度学习 人工智能 运维
AI为网络可靠性加“稳”——从断网烦恼到智能运维
AI为网络可靠性加“稳”——从断网烦恼到智能运维
583 2

热门文章

最新文章

下一篇
开通oss服务