复杂网络架构下的网络故障智能处理——DC Brain之故障篇

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: 本文PPT来自阿里巴巴产品经理何源(花名:荆杭)10月16日在2016年杭州云栖大会上发表的《复杂网络架构下的网络故障智能处理——DC Brain之故障篇》。

本文PPT来自阿里巴巴产品经理何源(花名:荆杭)10月16日在2016年杭州云栖大会上发表的《复杂网络架构下的网络故障智能处理——DC Brain之故障篇》。

网络是沟通世界的纽带,然而这个纽带却往往没有人们想象中的那么稳定。面对突如其来网络故障,网络工程师们经常会显得束手无策。与其他故障不同,网络故障的特殊性体现在1.体量大,经常涉及几万台网络设备和几百万端口2. 型号架构多,日志格式不统一,警告规则不统一 3.结构复杂,重复告警多 4. 自身依赖,监控系统本身运行在网络上。因此如何处理巨大的数据、不被海量的警告淹没、理清复杂的依赖关系和逻辑关系,是工程师们普遍关心的问题。

所以这里我们采用多元化、交叉覆盖的检测手段,根据可扩展、可自定义的规则并结合基于pagerank算法的告警收敛,利用告警监控系统冗余部署来检测网络系统异常。大体的思路是这样的:首先系统采集Syslog日志事件,并利用包含大量事件库的日志分类引擎来处理Syslog日志,最终再通过正则匹配使原本杂乱无章的系统日志变得简单明了。类似地,系统也会采集SNMP和Ping测事件,并且用包含对应规则库的规则引擎来分析处理这些事件。再经过引擎处理后,系统将根据告警等级和物理拓扑及协议拓扑将告警分发出去。

总结:大型的系统数据量每分钟可达千万级,因而基于spark streaming流式处理,spark graphX图算法这些单一的监控手段都会有失效的可能,所以要有多重手段。大数据不可怕,基础设施怕的是没有数据。所以既懂基础设施,又懂数据的人才很稀缺,将来会在市场上更具竞争力。

6d019db130e8660af2de1f9956cca6f0f331114e

d6bab1f3fd056bf64b352d7988a3ace8bfe5368f

b397a7f2b24ac63303703842bb58cf6b4008f00b

04f311cab7ac7879d8387bf7b5e64c4b1b0fa980

8b9a9265094aeeccec60897e813aacf9d0da8963

a8c93d95c43ee13ed36be550effeca739a402ea5

2554f6ad7e037837609ac35806a26f0f3f12665d

b542aa3570d0e8babe2f61ad8232ef14fa80c702

2b009e9d79def3c61ec7238e9604459f6a2adc8c

5da1fb9dab64657ad2230ba9ae5435a61d7cdda3

56ea148665b03e75e41225e68d91a651bcf239e8


相关文章
|
8天前
|
运维 监控 安全
|
2月前
|
运维 监控 安全
|
23天前
|
人工智能 安全 网络安全
瑞数信息:智能防护新时代,看AI如何筑起网络防线
在AI时代,网络安全面临新挑战与机遇。瑞数信息在2024中国科技方案资讯日上探讨如何利用AI强化安全防护。随着AI技术普及,网络攻击变得更复杂,传统安全手段捉襟见肘。瑞数信息通过动态安全与AI融合,打造动态防御系统,应对自动化攻击和勒索软件。其DDR解决方案利用AI进行深度文件内容检测和智能行为识别,提升数据安全。AI已成为网络安全革命的关键,瑞数信息等企业正通过技术创新塑造未来安全格局。
瑞数信息:智能防护新时代,看AI如何筑起网络防线
|
1月前
|
容器 Perl Kubernetes
深入 Kubernetes 网络:实战K8s网络故障排查与诊断策略
本文介绍了Kubernetes网络的基础知识和故障排查经验,重点讨论了私有化环境中Kubernetes网络的挑战。首先,文章阐述了Kubernetes网络模型的三大核心要素:Pod网络、Service网络和CNI,并强调了其在容器通信和服务发现中的作用。接着,通过三个具体的故障案例,展示了网络冲突、主节点DNS配置更改导致的服务中断以及容器网络抖动问题的解决过程,强调了网络规划、配置管理和人员培训的重要性。最后,提到了KubeSkoop exporter工具在监控和定位网络抖动问题中的应用。通过这些案例,读者可以深入了解Kubernetes网络的复杂性,并学习到实用的故障排查方法。
146573 19
|
1月前
|
传感器 监控 算法
【计算巢】无线传感器网络(WSN)在智能城市中的应用
【6月更文挑战第3天】智能城市中的无线传感器网络(WSN)在交通监控、环境监测、能源管理和公共安全等领域发挥关键作用。通过模拟代码展示了传感器收集环境数据的过程。尽管面临部署成本、网络安全和数据处理挑战,但WSN为城市发展带来巨大潜力,随着技术进步,将在智能城市中创造更多便利与改善。
【计算巢】无线传感器网络(WSN)在智能城市中的应用
|
1月前
|
机器学习/深度学习 计算机视觉 网络架构
是VGG网络的主要特点和架构描述
是VGG网络的主要特点和架构描述:
21 1
|
1月前
|
机器学习/深度学习 数据采集 运维
智能之网:深度学习在网络安全防御中的应用
随着网络攻击手段的日益复杂化,传统的安全防御措施已难以应对新型威胁。深度学习技术因其在数据处理和模式识别方面的强大能力,被广泛应用于网络安全领域。本文将探讨深度学习如何革新网络安全防御机制,包括其工作原理、应用实例及面临的挑战与未来发展方向。
|
1月前
|
机器学习/深度学习 人工智能 运维
智能之网:AI在网络安全防御中的新角色
【6月更文挑战第12天】随着人工智能技术的飞速发展,其在网络安全领域的应用也日益广泛。本文将探讨AI如何转变网络防御策略,通过实时学习与适应,提高对未知威胁的识别能力,从而构筑起一道更为坚固的安全防线。
|
25天前
|
网络协议 数据安全/隐私保护
|
1月前
|
网络协议 Java 网络安全
架构面试题汇总:网络协议34问(2024版)
架构面试题汇总:网络协议34问(2024版)