云网管 ---云上构建网络自动化体系

简介: 云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

1.背景

云网管是基于阿里云网络多年技术和经验沉淀打造的云上智能网络管理运维平台,提供企业网络全生命周期管理运维的能力,让部署更快捷、运维更高效、网络更透明。

1.1用户痛点

1.    安装部署难

传统网管大多都是本地部署,用户需要负责物理资源规划、中间件安装、安装包部署等等工作,通常需要专业的网络和IT维护人员数天甚至数周才能部署上线。

2.    集中管理难

网络设备自有的厂商网管,一般只能提供本地web访问方式,不能集中管理,更做不到跨厂商管理,无法给用户提供统一的管理视角,需要多套网管系统之间切换使用。

3.    网络扩展难

办公、零售场所随着业务的扩展,经常需要全国各地快速开店,目前网络的交付都是网络工程师通过console口登录一台台配置下发,效率低下且容易出错。

2.产品介绍

2.1 网络管理范围

     如下图定义网络管理的全生命周期,传统的网管系统,对网络的管理主要针对网络服役阶段,面向的是已上线网元的资源管理和运维监控等,无法做到网络设备的全生命周期管理。

cmn图片 1.png
 图1 网络管理全生命周期

 

云网管对网络的管理是贯穿整个生命周期的,在网络未上线的时候,可以离线规划设计,定义网络架构;在建设交付的时候,将定义好的网络架构以项目的方式进行实施,整个交付过程流程可控,质量可管;验收通过后,网络正式进入服役阶段,在该阶段网络的核心诉求是稳定运行、少出故障以及故障发生后的快速定位和故障恢复,云网管的监控、变更、巡检等模块确保网络服役阶段的稳定运行直到网络下线。在整个网络生命周期中,资源管理确保网络资源与真实网络的一致性。

2.2 产品功能介绍

2.2.1 建设交付

  • 架构设计

在网络尚未上线时可以预先进行网络规划,网络架构用于定义网络组网的互联规范和技术规格,提供图形化的架构设计和管理功能,通过图形化的方式进行组网拓扑的灵活编排,并对各个网络组件的具体规格进行配置。

如图通过可视化的方式进行网络架构设计,定义网络模块的数量和连接关系。cmn图片 2.png                                    图2 网络架构设计

结合设计好的网络规划和配置规范,自动生成可一键导入的标准配置文件。

cmn图片 3.png

                                      图3 配置文件生成

  • 建设交付

建设交付是将网络方案以项目的形式进行设备下发,在每个项目中以工单的形式控制交付过程和保障质量。

cmn图片4.png

                                  图4 建设交付项目实施

2.2.2 智能运维

  • 态势感知

通过全局视角和分支视角对网络整体状态进行实时感知。

健康度: 结合设备告警情况、网络巡检状况、监控覆盖程度等多维度对网络状况进行评分。

cmn图片5.png

动态拓扑: 通过LLDPMAC扫描技术准实时拓扑更新,设备连接关系、端口信息等实时呈现。

cmn图片 6.png

  • 一体化监控

    一个办公分支或者门店的网络,一般是涵盖了多个层次的网络,包含多种网络形态的设备。通常包括接入运营商的网关设备,进行数据转发的网络设备(路由器或交换机),提供WLAN的无线设备以及五花八门的终端应用。一套从网到端全链路覆盖的监控方案是必要的,因为往往端侧的异常,可能是有线网络的问题,有线侧的故障,会影响下游端侧多个终端或应用的使用。

cmn图片7.png

云网管针对有线网络、无线网络、终端应用等不同网络层次的设备,通过主动采集、事件接收、插件部署、主动拨测等多种监控技术,从网关到终端全链路监控网络运行情况。在如下的监控视图里将交换机上联口流量、到运营商的出口流量、AP的终端连接数以及终端的监控信息等有线和无线的指标在一个视图里完成监控。

cmn图片 8.png

  • 网络编排

云网管提供可视化的流程编排引擎,用户通过拖拽的方式将网络操作的原子能力串联起来,保障业务下发时的事务完整和安全。

  1.  完整业务流程编排定义

cmn图片 9.png

   2.单步配置流程可视化下发

cmn图片10.png

  • 故障自愈

日常高频的故障场景,基于云网管的网络编排能力,可以将告警联动处理方案,快速实现故障止血和业务恢复。

3.架构介绍

3.1 技术架构

cmn图片 11.png

  • 协议插件

云网管的协议插件集成了管理网络所需要的sshtelnetnetconfsnmpgrpc等协议,支持管理市面常见的商用网络设备。

协议插件通过加密的安全通道与云端的采集控制实例进行通信,高效执行云端下发的设备操作指令和采集任务,并将数据压缩后实时反馈给云端进行分析和展示。

协议插件的Agent支持以云网管自有硬件、软件安装包、集成SDWAN网关等多种方式输出。

  • 采集控制

采集控制实例在云端部署,在云网管的整体架构中起承上启下的作用。

调度引擎的工作流程: 1. 接收网络编排下发的任务,按任务优先级、调度计划等策略,将任务进行合理拆解和调度。2. 根据设备厂家型号等维度将指令通过模板翻译映射为操作设备的具体指令。3. 将指令下发到Agent执行,等待接收执行结果 4. 任务执行结果分析和拼装。

模板管理: 模板分为“用户模板”和“设备模板”两类,“用户模板”只具有业务含义,屏蔽了厂家差异,在网络编排中直接引用,“设备模板”是细化到厂商、型号粒度,不同的厂商之间都有明显差异。例如:“ACL策略”的设备模板,思科和华为是不同的指令。

  • 网络编排

网络编排负责业务模型的统一抽象和定义,网络编排将原子能力按业务流程进行串连,形成具体的网络方案。网络方案通过流程引擎驱动采集控制实例执行每一步的原子操作,以工单的方式控制事务完整和链路追踪。

  • 应用

网络编排以API的形式对应用提供能力和数据接口,应用层实现具体的“资源管理”、“网络巡检”、“网络变更”、“故障恢复”等能力,支持运维人员进行日常的网络运维、业务配置等工作。

3.2部署架构

云网管SaaS化部署,分钟级开通云上网管实例,用户侧只用部署探针(硬件版只需要上电和网络可达)即可。

云网管的计算和存储资源都是使用的阿里云资源,可以根据规格随时扩容,基于阿里云ASK集群实现的CI/CD功能,可以随时迭代上线新功能。

cmn图片12.png

4.总结

云网管致力于为复杂、异构、分支众多的线下网络打造一款免部署、易上手、集中管理的SaaS化网络运维管理平台。欢迎申请试用和加群交流(钉钉群35556346)。

相关文章
|
1天前
|
运维 监控 安全
构建高效自动化运维体系的五大支柱
【5月更文挑战第17天】 在当今IT基础设施管理领域,自动化不再是一个选择而是一个必然。本文将探讨构建高效自动化运维体系的核心要素,包括监控、配置管理、持续集成/持续部署(CI/CD)、故障响应以及安全策略的整合。通过深入分析这些关键组成部分,我们将揭示如何实现系统的稳定性、效率和安全性,同时减少人为错误并提升团队的响应能力。
|
1天前
|
监控 安全 数据安全/隐私保护
企业组网:构建智慧型网络基础设施,驱动未来商业发
随着数字化进程,企业组网演变为创新与竞争力的关键。智慧型网络基础设施助力企业内部协作效率提升,外部市场拓展及应对未来挑战。核心要素包括前瞻网络架构、高性能硬件、智能化软件和全面安全。实施策略涉及明确需求、制定方案、精细化实施、全面测试及持续优化,确保网络稳定、高效、安全。
10 3
企业组网:构建智慧型网络基础设施,驱动未来商业发
|
1天前
|
监控 安全 网络安全
构建安全防线:云计算环境下的网络安全策略
【5月更文挑战第17天】随着企业数字化转型步伐的加快,云计算已成为支撑现代业务架构的关键基石。然而,云服务的广泛应用同时带来了前所未有的安全挑战。本文旨在探讨云计算环境中的网络安全问题,并提出一系列创新的安全策略,以保障数据完整性、确保服务可用性并抵御网络威胁。我们将深入分析云服务模型(IaaS, PaaS, SaaS)与相应的安全考量,探讨加密技术、身份认证、访问控制以及入侵检测等关键技术在云环境中的应用,并讨论如何通过多层次防御策略和持续监控来强化整体安全性。
|
2天前
|
缓存 IDE Java
Java一分钟之-Gradle:构建自动化工具
【5月更文挑战第16天】本文介绍了Gradle,一个基于Groovy的灵活构建工具,强调其优于Maven的灵活性和性能。文中通过示例展示了基本的`build.gradle`文件结构,并讨论了常见问题:版本冲突、缓存问题和构建速度慢,提供了相应的解决策略。此外,还提醒开发者注意插件ID、语法错误和源代码目录等易错点。掌握这些知识能提升开发效率,使构建过程更顺畅。
21 2
|
3天前
|
运维 监控 算法
构建高效自动化运维体系的实践与思考
【5月更文挑战第15天】 随着信息技术的飞速发展,企业对IT运维管理的要求越来越高。传统的手动运维已无法满足日益增长的业务需求,因此,构建一个高效、可靠且易于管理的自动化运维体系变得至关重要。本文将探讨在现代企业环境中,如何通过一系列策略和技术手段实现运维自动化,以及在此过程中可能遇到的挑战和解决方案。文章将基于实际案例分析,提供一种系统性的思考框架,帮助读者理解和构建适合自己的自动化运维体系。
|
3天前
|
运维 资源调度 监控
构建高效自动化运维流程的策略与实践
【5月更文挑战第15天】 在现代IT基础设施管理中,自动化运维已成为提高效率、确保稳定性和快速响应变化的关键。本文将探讨构建高效自动化运维流程的策略与实践,重点在于如何通过一系列切实可行的步骤实现从人工密集型到自动化驱动的转变。我们将讨论工具选择、流程设计、最佳实践以及持续改进的重要性,旨在帮助读者构建一个既灵活又可靠的自动化运维环境。
28 3
|
3天前
|
运维 监控 Kubernetes
构建高效自动化运维体系:基于容器技术的持续集成与持续部署(CI/CD)实践
【5月更文挑战第15天】 随着云计算和微服务架构的普及,传统的IT运维模式面临转型压力。为提高软件交付效率并降低运维成本,本文探讨了利用容器技术实现自动化运维的有效策略。重点分析了在持续集成(CI)和持续部署(CD)流程中,容器如何发挥作用,以及它们如何帮助组织实现敏捷性和弹性。通过具体案例研究,文章展示了容器化技术在自动化测试、部署及扩展中的应用,并讨论了其对系统稳定性和安全性的影响。
|
3天前
|
Java Maven
Maven 自动化构建
**Maven自动化构建确保依赖稳定性:当bus-core-api(1.0-SNAPSHOT)构建完成时,自动触发app-web-ui(依赖1.0)的构建,保证上下游项目同步。**
|
3天前
|
运维 监控 安全
构建高效自动化运维系统:基于容器技术的持续集成与持续部署(CI/CD)实践
【5月更文挑战第14天】 随着DevOps文化的深入人心,持续集成与持续部署(CI/CD)已成为现代软件工程不可或缺的组成部分。本文将探讨如何利用容器技术,尤其是Docker和Kubernetes,构建一个高效、可扩展的自动化运维系统。通过深入分析CI/CD流程的关键组件,我们将讨论如何整合这些组件以实现代码从提交到生产环境的快速、无缝过渡。文章还将涉及监控、日志管理以及安全性策略等运维考量,为读者提供一个全面的自动化运维解决方案蓝图。
|
3天前
|
SQL 安全 网络安全
构建安全防线:云计算环境中的网络安全策略与实践
【5月更文挑战第14天】 随着企业逐渐将关键业务流程迁移到云端,云计算服务的安全性成为不容忽视的重要议题。本文深入探讨了在动态且复杂的云环境中实施有效的网络安全措施的策略和技术。通过分析当前云计算模型中的安全挑战,我们提出了一系列创新的安全框架和防御机制,旨在保护数据完整性、确保业务连续性并抵御不断演变的网络威胁。文中不仅涵盖了理论分析和案例研究,还对未来云计算安全技术的发展趋势进行了预测。