“云网管” ---云上构建网络自动化体系

本文涉及的产品
云网管,50台设备规模 3个月
简介: 云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

云网管更多内容:https://yqh.aliyun.com/live/cmn_release

1.背景

云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

1.1用户痛点

1.安装部署难

传统网管大多都是本地部署,用户需要负责物理资源规划、中间件安装、安装包部署等等工作,通常需要专业的网络和IT维护人员数天甚至数周才能部署上线。

2.集中管理难

网络设备自有的厂商网管,一般只能提供本地web访问方式,不能集中管理,更做不到跨厂商管理,无法给用户提供统一的管理视角,需要多套网管系统之间切换使用。

3.网络扩展难

办公、零售场所随着业务的扩展,经常需要全国各地快速开店,目前网络的交付都是网络工程师通过console口登录一台台配置下发,效率低下且容易出错。

2.产品介绍

2.1网络管理范围

如下图定义网络管理的全生命周期,传统的网管系统,对网络的管理主要针对网络服役阶段,面向的是已上线网元的资源管理和运维监控等,无法做到网络设备的全生命周期管理。

image.png

图1 网络管理全生命周期

云网管对网络的管理是贯穿整个生命周期的,在网络未上线的时候,可以离线规划设计,定义网络架构;在建设交付的时候,将定义好的网络架构以项目的方式进行实施,整个交付过程流程可控,质量可管;验收通过后,网络正式进入服役阶段,在该阶段网络的核心诉求是稳定运行、少出故障以及故障发生后的快速定位和故障恢复,云网管的监控、变更、巡检等模块确保网络服役阶段的稳定运行直到网络下线。在整个网络生命周期中,资源管理确保网络资源与真实网络的一致性。

2.2 产品功能介绍

2.2.1 建设交付

  • 架构设计

在网络尚未上线时可以预先进行网络规划,网络架构用于定义网络组网的互联规范和技术规格,提供图形化的架构设计和管理功能,通过图形化的方式进行组网拓扑的灵活编排,并对各个网络组件的具体规格进行配置。

如图通过可视化的方式进行网络架构设计,定义网络模块的数量和连接关系。

image.png

图2 网络架构设计

结合设计好的网络规划和配置规范,自动生成可一键导入的标准配置文件。

image.png

图3 配置文件生成

  • 建设交付

建设交付是将网络方案以项目的形式进行设备下发,在每个项目中以工单的形式控制交付过程和保障质量。

image.png

图3 建设交付项目实施

2.2.2 智能运维

  • 态势感知

通过全局视角和分支视角对网络整体状态进行实时感知。

健康度: 结合设备告警情况、网络巡检状况、监控覆盖程度等多维度对网络状况进行评分。

image.png

动态拓扑: 通过LLDP和MAC扫描技术准实时拓扑更新,设备连接关系、端口信息等实时呈现。


image.png


  • 一体化监控

一个办公分支或者门店的网络,一般是涵盖了多个层次的网络,包含多种网络形态的设备。通常包括接入运营商的网关设备,进行数据转发的网络设备(路由器或交换机),提供WLAN的无线设备以及五花八门的终端应用。一套从网到端全链路覆盖的监控方案是必要的,因为往往端侧的异常,可能是有线网络的问题,有线侧的故障,会影响下游端侧多个终端或应用的使用。


image.png


云网管针对有线网络、无线网络、终端应用等不同网络层次的设备,通过主动采集、事件接收、插件部署、主动拨测等多种监控技术,从网关到终端全链路监控网络运行情况。在如下的监控视图里将交换机上联口流量、到运营商的出口流量、AP的终端连接数以及终端的监控信息等有线和无线的指标在一个视图里完成监控。


image.png


  • 网络编排

云网管提供可视化的流程编排引擎,用户通过拖拽的方式将网络操作的原子能力串联起来,保障业务下发时的事务完整和安全。

1.完整业务流程编排定义

image.png

2.单步配置流程可视化下发


image.png

  • 故障自愈

日常高频的故障场景,基于云网管的网络编排能力,可以将告警联动处理方案,快速实现故障止血和业务恢复。

3.架构介绍

3.1技术架构

image.png

  • 协议插件

云网管的协议插件集成了管理网络所需要的ssh、telnet、netconf、snmp、grpc等协议,支持管理市面常见的商用网络设备。

协议插件通过加密的安全通道与云端的采集控制实例进行通信,高效执行云端下发的设备操作指令和采集任务,并将数据压缩后实时反馈给云端进行分析和展示。

协议插件的Agent支持以云网管自有硬件、软件安装包、集成SDWAN网关等多种方式输出。

  • 采集控制

采集控制实例在云端部署,在云网管的整体架构中起承上启下的作用。

调度引擎的工作流程: 1. 接收网络编排下发的任务,按任务优先级、调度计划等策略,将任务进行合理拆解和调度。2. 根据设备厂家型号等维度将指令通过模板翻译映射为操作设备的具体指令。3. 将指令下发到Agent执行,等待接收执行结果 4. 任务执行结果分析和拼装

模板管理: 模板分为“用户模板”和“设备模板”两类,“用户模板”只具有业务含义,屏蔽了厂家差异,在网络编排中直接引用,“设备模板”是细化到厂商、型号粒度,不同的厂商之间都有明显差异。例如:“ACL策略”的设备模板,思科和华为是不同的指令。

  • 网络编排

网络编排负责业务模型的统一抽象和定义,网络编排将原子能力按业务流程进行串连,形成具体的网络方案。网络方案通过流程引擎驱动采集控制实例执行每一步的原子操作,以工单的方式控制事务完整和链路追踪。

  • 应用

网络编排以API的形式对应用提供能力和数据接口,应用层实现具体的“资源管理”、“网络巡检”、“网络变更”、“故障恢复”等能力,支持运维人员进行日常的网络运维、业务配置等工作。

3.2部署架构

云网管SaaS化部署,分钟级开通云上网管实例,用户侧只用部署探针(硬件版只需要上电和网络可达)即可。

云网管的计算和存储资源都是使用的阿里云资源,可以根据规格随时扩容,基于阿里云ASK集群实现的CI/CD功能,可以随时迭代上线新功能。

image.png

4.总结

云网管致力于为复杂、异构、分支众多的线下网络打造一款免部署、易上手、集中管理的SaaS化网络运维管理平台。欢迎申请试用和加群交流。

https://common-buy.aliyun.com/?spm=5176.21109098.J_3759233040.1.1c5dc777vP6U7p&commodityCode=cmn_aliyun_public_cn®ionId=cn-hangzhou

云网管服务交流钉钉群: 35556346

相关文章
|
20天前
|
存储 监控 安全
单位网络监控软件:Java 技术驱动的高效网络监管体系构建
在数字化办公时代,构建基于Java技术的单位网络监控软件至关重要。该软件能精准监管单位网络活动,保障信息安全,提升工作效率。通过网络流量监测、访问控制及连接状态监控等模块,实现高效网络监管,确保网络稳定、安全、高效运行。
46 11
|
3天前
|
人工智能
LangGraph:构建多代理动态工作流的开源框架,支持人工干预、循环、持久性等复杂工作流自动化
LangGraph 是一个基于图结构的开源框架,专为构建状态化、多代理系统设计,支持循环、持久性和人工干预,适用于复杂的工作流自动化。
31 12
LangGraph:构建多代理动态工作流的开源框架,支持人工干预、循环、持久性等复杂工作流自动化
|
2天前
|
容灾 网络协议 数据库
云卓越架构:云上网络稳定性建设和应用稳定性治理最佳实践
本文介绍了云上网络稳定性体系建设的关键内容,包括面向失败的架构设计、可观测性与应急恢复、客户案例及阿里巴巴的核心电商架构演进。首先强调了网络稳定性的挑战及其应对策略,如责任共担模型和冗余设计。接着详细探讨了多可用区部署、弹性架构规划及跨地域容灾设计的最佳实践,特别是阿里云的产品和技术如何助力实现高可用性和快速故障恢复。最后通过具体案例展示了秒级故障转移的效果,以及同城多活架构下的实际应用。这些措施共同确保了业务在面对网络故障时的持续稳定运行。
|
3天前
|
运维 监控 Cloud Native
构建深度可观测、可集成的网络智能运维平台
本文介绍了构建深度可观测、可集成的网络智能运维平台(简称NIS),旨在解决云上网络运维面临的复杂挑战。内容涵盖云网络运维的三大难题、打造云原生AIOps工具集的解决思路、可观测性对业务稳定的重要性,以及产品发布的亮点,包括流量分析NPM、网络架构巡检和自动化运维OpenAPI,助力客户实现自助运维与优化。
|
3天前
|
人工智能 大数据 网络性能优化
构建超大带宽、超高性能及稳定可观测的全球互联网络
本次课程聚焦构建超大带宽、超高性能及稳定可观测的全球互联网络。首先介绍全球互联网络的功能与应用场景,涵盖云企业网、转发路由器等产品。接着探讨AI时代下全球互联网络面临的挑战,如大规模带宽需求、超低时延、极致稳定性和全面可观测性,并分享相应的解决方案,包括升级转发路由器、基于时延的流量调度和增强网络稳定性。最后宣布降价措施,降低数据与算力连接成本,助力企业全球化发展。
|
3天前
|
弹性计算 运维 安全
云上DevOps自动化的最佳实践
本文介绍了云上DevOps自动化最佳实践,重点探讨了企业在上云过程中面临的成本管理、运维效率和弹性等问题。通过阿里云的产品和服务,企业可以实现自动化的资源管理、成本优化和高效运维。文章详细阐述了如何利用标签进行成本分析、选择合适的付费类型和实例规格、以及通过弹性伸缩降低成本。此外,还介绍了新功能发布,如统一的实例运维通道界面、AI辅助的运维工具等,帮助企业提升云上业务的管理和运营效率。
|
14天前
|
数据采集 机器学习/深度学习 人工智能
基于AI的网络流量分析:构建智能化运维体系
基于AI的网络流量分析:构建智能化运维体系
87 13
|
18天前
|
Serverless 决策智能 UED
构建全天候自动化智能导购助手:从部署者的视角审视Multi-Agent架构解决方案
在构建基于多代理系统(Multi-Agent System, MAS)的智能导购助手过程中,作为部署者,我体验到了从初步接触到深入理解再到实际应用的一系列步骤。整个部署过程得到了充分的引导和支持,文档详尽全面,使得部署顺利完成,未遇到明显的报错或异常情况。尽管初次尝试时对某些复杂配置环节需反复确认,但整体流程顺畅。
|
23天前
|
缓存 监控 安全
公司电脑监控软件的 Gradle 构建自动化优势
在数字化办公环境中,公司电脑监控软件面临代码更新频繁、依赖管理和构建复杂等挑战。Gradle 构建自动化工具以其强大的依赖管理、灵活的构建脚本定制及高效的构建缓存与增量构建特性,显著提升了软件开发效率和质量,支持软件的持续更新与优化,满足企业对员工电脑使用情况的监控与管理需求。
35 3
|
27天前
|
云安全 人工智能 安全

热门文章

最新文章