• 下一代数据中心架构(第2版)》一1.6 故障排查

    NX-OS与Cisco Nexus交换技术:下一代数据中心架构(第2版)本节将介绍在配置和使用Cisco NX-OS的过程中,对可能出现的问题进行故障排查的基本概念、方法以及通用故障排查指南。1.6.1 show命令 表1-2列出了常见的EXEC...
    文章 2017-05-02 1390浏览量
  • Cato Networks为其SD-WAN增加了自我修复功能

    现在,X1700设备具有冗余电源和冗余热插拔驱动器,可以保护数据中心免受常见组件故障的影响。Cato的SD-WAN设备内置了自我修复和高可用性。今年早些时候,Cato 在其SD-WAN中建立了威胁搜寻系统。这使得企业不再需要...
    文章 2018-10-19 1837浏览量
  • 这些常见网络故障,你都知道如何解决吗

    很多弱电圈的朋友经常提到网络故障,其中在交换机组网时常见故障比较多,为了便于大家排除这些故障,在此介绍一些常见的典型故障案例及处理思路。故障 1:交换机刚加电时网络无法通信 故障现象 交换机刚刚开启的...
    文章 2018-10-25 1427浏览量
  • ECS学习心得1

    ECS在底层对每份数据进行多次备份,物理层面拥有超A级数据中心,通过双路独市电引入、三路网络和N+1柴油发电机后备电源确保数据安全。ECS自动化运维将数据迁移到其他物理机,将数据恢复到故障前最后状态,屏蔽...
    文章 2020-09-23 87浏览量
  • 【剖析|SOFARPC 框架】之SOFARPC 单机故障剔除剖析

    如果 Provider 出现心跳异常或长连接不存在,则及时将服务从注册中心剔除,并告知 Consumer 移除本地缓存的故障 Provider 信息。Comsumer 在负载均衡选择时则不考虑被剔除的 Provider,如图所示: 而 SOFARPC 单机...
    文章 2018-11-02 1093浏览量
  • 【剖析|SOFARPC 框架】系列之 SOFARPC 单机故障剔除...

    如果 Provider 出现心跳异常或长连接不存在,则及时将服务从注册中心剔除,并告知 Consumer 移除本地缓存的故障 Provider 信息。Comsumer 在负载均衡选择时则不考虑被剔除的 Provider,如图所示: 而 SOFARPC 单机...
    文章 2019-08-03 388浏览量
  • 数据中心网络运维必杀技满满“套路”得人心

    随着业务不断增长,数据中心常见规模从以前几个机柜,发展到如今成百上千个机柜,原先相对简单的运维工作,复杂程度呈几何系数的增长。这背后,是一大堆相关部门的协同工作,是夜以继日的开会、协同办公,是运维人员...
    文章 2018-05-17 13368浏览量
  • 初探微服务架构

    而且在服务的调用过程中,服务的请求耗时、调用量以及成功率等指标都会被记录下来用作监控,调用经过的链路信息会被记录下来,用于故障定位和问题追踪。在这期间,如果调用失败,可以通过重试等服务治理手段来保证...
    文章 2019-10-30 1104浏览量
  • 微数据中心如何为未来企业提供竞争力?

    根据Ponemon Institute LLC的调查,最常见的计划外数据中心中断的原因是不间断电源设备故障。随着中心系统变得越来越庞大和复杂,麻烦的可能性也随之增加。体积小的、分布式的数据中心则较少遇到这样的问题。在...
    文章 2017-07-10 813浏览量
  • 应对数据中心常见问题的IT监控策略

    本文介绍3个数据中心常见的问题,管理员通过IT监控操作,能够提前做好准备处理这些问题。操作问题 如果修复BUG的周期长达12个月甚至更长,这清楚的表明了现有系统(例如COBOL)以及造成如此长周期的操作流程应该被替换...
    文章 2017-07-03 975浏览量
  • 135认证考试指南》——2.4节利用Cisco IOS收集信息

    本节将介绍用于收集网络信息常见Cisco IOS命令,并讨论过滤这些命令输出结果中无关信息的方式。此外,本节还将介绍一些非常有用的诊断连接性故障或硬件故障的命令。2.4.1 过滤show命令的输出结果Cisco IOS提供了...
    文章 2017-05-02 1135浏览量
  • 应对数据中心常见问题的IT监控策略

    本文介绍3个数据中心常见的问题,管理员通过IT监控操作,能够提前做好准备处理这些问题。操作问题 如果修复BUG的周期长达12个月甚至更长,这清楚的表明了现有系统(例如COBOL)以及造成如此长周期的操作流程应该被替换...
    文章 2017-08-02 727浏览量
  • 95期:Docker常见故障排查指南大全

    Docker常见故障排查指南大全 对于Docker的初学者而言,当容器或应用出现了问题不知从何入手进行排查。为此,我们准备了一个简单指南来帮助阿里云容器服务的用户进行故障排查,点击查看。Freeline-Android平台上的秒...
    文章 2016-11-07 8470浏览量
  • 《通信技术导论(原书第5版)》——2...下一代数据中心...

    公营及私营机构、云设施和运营商网络均设有自己的数据中心。下一代数据中心支持:设备间千兆比特速率通信。虚拟化减少了存储文件和运行应用程序的物理服务器的数量。2.2.1 数据中心的私有云企业和商业机构对于将...
    文章 2017-05-02 1222浏览量
  • BAT解密:互联网技术发展之路(7)-网络层技术剖析

    但多中心的要求就高多了,要求每个中心都同时对外提供服务,且业务能够自动在多中心之间切换,故障后不需人工干预或者很少人工干预就能自动恢复。多中心设计的关键就在于“数据一致性”和“数据事务性”如何保证,但...
    文章 2015-11-11 2605浏览量
  • 容灾切换必备-全局流量管理介绍

    底层服务使用的是“云解析DNS”和“云监控”两款产品,集成了DNS的智能解析功能、云监控的应用服务监控功能,为客户输出不同网络或地区用户访问实现就近接入、应用服务运行状态的健康检查、故障自动切换等能力。...
    文章 2020-04-13 1265浏览量
  • 分布式存储系统基础

    例如,某分布式系统部署在两个数据中心,由于网络调整,导致数据中心之间无法通信,但是,数据中心内部可以正常通信。磁盘故障 磁盘故障可以分为两种情况:磁盘损坏和磁盘数据错误。磁盘损坏时,将会丢失存储在上面...
    文章 2017-08-09 1639浏览量
  • Azure站点恢复服务:应用于数据与虚拟机复制

    例如,一个常见的用例就是将基于Hyper-V的系统复制至Azure。大多数用户都会在Azure管理控制台上执行配置任务;首先的方法是通过Azure门户网站使用Azure资源管理器,因为它支持更广泛的功能与部属模式。虽然云基础架构...
    文章 2017-08-09 990浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    通过对阿里巴巴历年故障的仔细梳理,阿里巴巴集团内的核心业务的常见故障(非业务自身逻辑问题)都可以通过流量、时延、错误等 3 类指标反应出来,我们称之为黄金指标:流量:业务流量跌零 OR 不正常大幅度上涨下跌...
    文章 2021-07-06 239浏览量
  • 玩转ECS第6讲|弹性计算Region化部署和跨可用区容灾...

    以上两种跨可用区容灾方式较为实用、常见,实现条件均是可用区之间具备网络、电力的物理隔离以及低延迟特点。3.跨Region部署 此处仅介绍较为简单的跨Region部署模式。首先进行地域划分。Region化部署完成后,每个...
    文章 2020-11-05 5246浏览量
  • 数据中心规划设计对空调制冷系统的六大要求

    管理系统必须清楚地描述任何问题,提供与问题症状更加相符的数据报告以及出现问题时详细的系统性能状况信息,以便进行故障排除,提供预测性故障分析。许多冷却组件都会出人意料地发生故障或中断,或者在没有通知的...
    文章 2017-09-01 1266浏览量
  • VMware vSphere常见问题汇总(十二)

    通常是由更为严重的问题引起的,例如,主机或代理出现故障或存在网络问题。n 群集包含比其他虚拟机具有更大内存或 CPU 预留的虚拟机。“群集允许的主机故障数目”接入控制策略基于对插槽大小(由虚拟机的 CPU 和内存...
    文章 2017-11-14 1459浏览量
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    2017年2月份国内的一家经常被用来测试网络连通性的友商也出现了故障,工信部迅速关注,并紧急约谈了相关公司。同时下发紧急通知要求BAT等各重点互联网企业吸取教训,业界一片哗然。这时候,有一家公司显得特别淡定,...
    文章 2017-06-19 3717浏览量
  • AI助力日志中心智能化运营

    时间戳是日志的关键信息,时间戳后的数值即为常见的监控消息,更广泛时,变更的事件例如某一时间点某一业务的上线也可作为一种日志事件,当日志平台真正做好AIOps时,需要提供全面的日志信息。就日志易而言,目前对...
    文章 2018-06-23 10130浏览量
  • 鲜为人知的混沌工程,到底哪里好?

    要确定是否已准备好开始采用混沌工程,需要回答一个问题:你的系统是否能够适应现实世界中的事件,例如服务故障网络延迟峰值?如果答案是“否”,那么你还有一些工作要做。混沌工程非常适合揭露生产系统中未知的...
    文章 2019-01-29 3138浏览量
  • OSS服务监控、诊断和故障排除

    因为,捕获客户端和服务器之间的流量,可以更详细地获取客户端和服务器之间交换的数据以及底层网络状况的详细信息,帮助问题的调查,例如,在某些情况下,用户请求可能会报告一个错误,而服务器端日志中却看不到任何...
    文章 2016-05-19 29602浏览量
  • 日志系统的 AIOps 应用,及日志易智能日志中心运营之...

    其中,时间戳是日志的关键信息,时间戳后的数值即为常见的监控信息。更广义上说,变更的事件——例如某一时间点某一业务的上线,也可作为一种日志事件。当日志平台真正做好 AIOps 时,需要提供全面的日志信息。就...
    文章 2018-11-23 1749浏览量
  • Riverbed发布业界最全面的数字体验管理解决方案

    云性能,特别是与网络相关的性能,对大多数企业而言都是常见的盲点。本次发布的SteelCentral版本引入了应用迁移规划与预测,使得网络规划和架构团队能够在应用迁移之前模拟并预测流量行为及其对网络的影响——从数据...
    文章 2017-09-01 978浏览量
  • 日志易饶琛琳分享:AI 助力日志中心智能化运营

    时间戳是日志的关键信息,时间戳后的数值即为常见的监控信息,更广义上,变更的事件例如某一时间点某一业务的上线也可作为一种日志事件,当日志平台真正做好 AIOps 时,需要提供全面的日志信息。就日志易而言,目前...
    文章 2018-09-25 2154浏览量
  • 《策略驱动型数据中心——ACI技术详解》——第1章 ...

    构建数据中心网络矩阵时,一定要考虑到将来会在每台主机上运行的虚拟机数量和应用数量,这些信息可为使用超载比提供指导。虚拟化具有多个层面。例如,运行虚拟环境的云提供商可能允许其用户也运行自己的虚拟机管理...
    文章 2017-05-02 2024浏览量
1 2 3 4 ... 21 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化