GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

本文涉及的产品
云网管,50台设备规模 3个月
简介: GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享

首图-图标.png


【阅读原文】戳:GOPS 全球运维大会 | 阿里云网络自动化运维体系落地实践分享



10月28日-29日,第十八届GOPS全球运维大会GOPS 2022在上海顺利召开。作为国内规模最大的高端运维盛会之一,大会涵盖了DevOps、AIOps、DevSecOps、云原生、效能度量等多个技术领域,此外还特设了自动化运维、云原生及DevOps 实践等特色专场。阿里云基础设施网络团队资深技术专家林涛受邀分享阿里云基础设施网络在自动化运维体系方面的落地实践


B4B749E6-3FBC-4042-B364-9E0521A50CE3.png

GOPS全球运维大会由高效运维社区(GreatOPS)、开放运维联盟(OOPSA)和 DevOps时代社区联合主办,是国内第一个面向互联网、金融、通信及传统行业广大运维技术人员的运维行业大会,旨在传播先进技术思想和理念,分享业内最佳实践。


全球运维大会 林涛1.jpg

图|阿里云基础设施网络团队资深技术专家林涛分享阿里云基础设施网络在自动化运维体系方面的落地实践


林涛回顾了阿里巴巴网络基础设施的超大规模发展历史。阿里云网络基础设施设备规模数的飞速增长使得网络架构异常复杂,同时给系统的稳定性等带来了很大挑战。面对诸多运维困难,阿里云基础设施网络自动化团队自主研发了覆盖网络运维全生命周期的网络自动化运维系统,涵盖资产管理、网络架构规划、交付、变更、监控、运营等主要能力,通过制定完善的运维体系并沉淀成系统能力,极大地提高了基础设施网络的稳定性。


林涛在分享中还强调:网络自动运维体系搭建带来的不仅是系统稳定性的提高,通过系统来实现自动化运维、智能运维,还能极大地提高运维效率。阿里巴巴基础设施在规模化增长的过程中,网络自动化团队人员的投入并没有同步增加,为公司带来了非常好的降本提效效益。在实际运维工作中,运维同学还能将自己的运维经验沉淀成系统的标准运维方案,极大地提高了整个团队的运维水准和效率。


运维大会.jpg


历经打磨,阿里云基础设施网络团队已成功将积累多年建设成熟的网络自动化运维系统产品化输出到阿里云平台,形成了标准的商业化产品——云网管CMN。产品面向所有公共云、专有云等客户开放,适用于数据中心运维、办公网运维、连锁分支门店网络运维、场馆展会网络运维等业务场景。


阿里云“云网管”产品主要包括设备资产管理、网络建设规划、设备监控告警、SYSLOG日志、流量分析、网络拓扑可视化、网络自动化、巡检等主要能力,在不通厂商、不同型号设备纳管方面具有独特优势,支持市面上主流厂家服务器、网络设备、防火墙、无线AP、IOT终端等的统一管理监控运维。产品开箱即用,安装探针后可自动发现网络中设备并一键纳入管理,功能操作简单方便易用,产品功能提供API可方便与第三方业务系统集成。


当前大型企业IT架构复杂,在本地建有数据中心的同时,可能也在同时使用各类公共云厂商的服务。阿里云“云网管”除了能对客户自建数据中心进行管理外,还能统一监管各类公共云上资源,为客户提供多云与线下数据中心的统一融合监管控运维方案。


展望未来,阿里云基础设施网络团队将结合自身优势,携手业内硬件生态厂商伙伴,持续加强产品异构设备、云上资源统一监管控能力,聚焦智能化运维体系标准建设及产品化,为推动IT基础设施朝智能化方向演进不断贡献力量!



点击 此处 了解更多“阿里云云网管”产品



我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。


相关文章
|
3天前
|
存储 弹性计算 运维
云端问道 7 期实践教学-使用操作系统智能助手 OS Copilot 轻松运维与编程
使用操作系统智能助手 OS Copilot 轻松运维与编程
26 14
|
8天前
|
运维 供应链 安全
阿里云先知安全沙龙(武汉站) - 网络空间安全中的红蓝对抗实践
网络空间安全中的红蓝对抗场景通过模拟真实的攻防演练,帮助国家关键基础设施单位提升安全水平。具体案例包括快递单位、航空公司、一线城市及智能汽车品牌等,在演练中发现潜在攻击路径,有效识别和防范风险,确保系统稳定运行。演练涵盖情报收集、无差别攻击、针对性打击、稳固据点、横向渗透和控制目标等关键步骤,全面提升防护能力。
|
3天前
|
负载均衡 容灾 Cloud Native
云原生应用网关进阶:阿里云网络ALB Ingress 全能增强
在过去半年,ALB Ingress Controller推出了多项高级特性,包括支持AScript自定义脚本、慢启动、连接优雅中断等功能,增强了产品的灵活性和用户体验。此外,还推出了ingress2Albconfig工具,方便用户从Nginx Ingress迁移到ALB Ingress,以及通过Webhook服务实现更智能的配置校验,减少错误配置带来的影响。在容灾部署方面,支持了多集群网关,提高了系统的高可用性和容灾能力。这些改进旨在为用户提供更强大、更安全的云原生网关解决方案。
34 4
|
14天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
87 13
|
10天前
|
存储 监控 安全
网络安全视角:从地域到账号的阿里云日志审计实践
日志审计的必要性在于其能够帮助企业和组织落实法律要求,打破信息孤岛和应对安全威胁。选择 SLS 下日志审计应用,一方面是选择国家网络安全专用认证的日志分析产品,另一方面可以快速帮助大型公司统一管理多组地域、多个账号的日志数据。除了在日志服务中存储、查看和分析日志外,还可通过报表分析和告警配置,主动发现潜在的安全威胁,增强云上资产安全。
|
12天前
|
SQL 运维 安全
网络安全等级保护2.0 定级、评测、实施与运维-复习题目资料
本文详细总结了网络信息安全等级保护的练习题,包括单选题、多选题、判断题和简答题。供朋友们参考复习,学习相关领域知识参考。
|
27天前
|
云安全 人工智能 安全
|
5天前
|
运维 监控 Cloud Native
云原生之运维监控实践:使用 taosKeeper 与 TDinsight 实现对 时序数据库TDengine 服务的监测告警
在数字化转型的过程中,监控与告警功能的优化对保障系统的稳定运行至关重要。本篇文章是“2024,我想和 TDengine 谈谈”征文活动的三等奖作品之一,详细介绍了如何利用 TDengine、taosKeeper 和 TDinsight 实现对 TDengine 服务的状态监控与告警功能。作者通过容器化安装 TDengine 和 Grafana,演示了如何配置 Grafana 数据源、导入 TDinsight 仪表板、以及如何设置告警规则和通知策略。欢迎大家阅读。
23 0
|
3月前
|
运维 Linux Apache
,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具
【10月更文挑战第7天】随着云计算和容器化技术的发展,自动化运维成为现代IT基础设施的关键部分。Puppet是一款强大的自动化运维工具,通过定义资源状态和关系,确保系统始终处于期望配置状态。本文介绍Puppet的基本概念、安装配置及使用示例,帮助读者快速掌握Puppet,实现高效自动化运维。
70 4
|
2天前
|
人工智能 运维 监控
AI辅助的运维流程自动化:实现智能化管理的新篇章
AI辅助的运维流程自动化:实现智能化管理的新篇章
37 22

热门文章

最新文章