• 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络拓扑...
    文章 2017-08-01 1040浏览量
  • 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络拓扑...
    文章 2017-07-03 764浏览量
  • 你真的确定做好网络测试的准备了吗?

    而且,如果不清楚流量在稳定状态和故障状态下的传输情况,则很难理解一次宕机发生的原因,也很难去集成新的技术。举一个简单的例子,为什么 ISP-A出现故障时,ISP-B的出口不会接管工作?如果网络工程师理解网络拓扑...
    文章 2017-09-02 940浏览量
  • 以管理为轴心 为IT服务保驾护航——北京赛特百货有限...

    一旦该平台出现宕机或者严重性能问题,Mocha BSM将通过多种方式进行告警。以最快的速度通知相关管理人员,对该业务系统进行及时处理。全面灵活的基本资源监控 赛特百货的网络设备相对较多,大部分为交换机,同样品牌...
    文章 2017-11-15 947浏览量
  • 阿里基础设施的智能监控

    此外同一个安全域内不同采集域可以互相指定为备份采集域,如果某个采集域内的所有采集机都宕机,那么备份采集域的采集机会承担宕机的采集域所承担设备的采集任务,这个称之为跨采集域容灾。Syslog和AAA日志采集是由...
    文章 2019-07-30 1295浏览量
  • 《路由设计的优化》一1.3 可靠性和弹性

    很明显,即使网络设备的可靠性非常高,但是只要网络大到一定的规模,那么网络将不可避免地处于经常性的变动状态,变更的原因可能是设备故障,也可能是网络优化调整。因此,尽管可以通过减少网络变更和故障发生率来...
    文章 2017-05-02 1174浏览量
  • 遵循ITIL流程框架,运维工作进入规范化新纪元——...

    管理员只需输入核心交换机的IP地址,系统将自动发现企业网的二层和三层拓扑,以生动的图形展现出来,并能够立刻开始监控所有已发现网络资源的状态和链路的状态。功能亮点 Mocha BSM 通过Portal的统一展现,对基础...
    文章 2017-11-14 1114浏览量
  • 网络“高速公路”首秀双11|探秘阿里巴巴HAIL数据中心...

    实际运行过程中也体现了这一点,两台TOR由于堆叠系统的软硬件bug原因导致同时宕机的情况屡见不鲜,对业务系统的稳定性形成了很大的挑战。去堆叠设计 5.1网络架构中,我们创新性的实现了服务器双活接入+TOR去堆叠(如...
    文章 2018-11-22 2283浏览量
  • 网络“高速公路”首秀双11|探秘阿里巴巴HAIL数据中心...

    实际运行过程中也体现了这一点,两台TOR由于堆叠系统的软硬件bug原因导致同时宕机的情况屡见不鲜,对业务系统的稳定性形成了很大的挑战。去堆叠设计 5.1网络架构中,我们创新性的实现了服务器双活接入+TOR去堆叠(如...
    文章 2019-07-31 1278浏览量
  • RPC服务注册&发现

    该节点承担着最重要的职责,它由服务提供者(发布服务时)创建,以供服务消费者获取节点中的信息,从而定位到服务提供者真正网络拓扑位置以及得知如何调用。服务发现 服务消费者在第一次调用服务时,会通过注册中心...
    文章 2018-07-27 1461浏览量
  • Nacos发布0.5.0版本,轻松玩转动态 DNS 服务

    对于复杂的云环境和网络拓扑环境中(如 VPC、边缘网络等)服务的健康检查,Nacos 提供了心跳上报模式和服务端主动探测2种健康检查模式。所以随着Nacos 0.5.0 版本的发布,我们很高兴的宣布,Nacos已经正式支持基于...
    文章 2018-11-27 2156浏览量
  • 蚂蚁智能监控

    容灾架构 前文简要提及了架构去单点问题的解决思路,这足以覆盖日常可能发生的节点宕机网络抖动等小规模故障场景,但是当真正的毁灭性灾难来临时,还需要更高层面的容灾方案来应对。目前基于不同租户保障等级的...
    文章 2021-09-07 33浏览量
  • 阿里云专家详解 2020 服务网格发展趋势

    如果实例已经由于各种原因宕机,或者请求根本没有响应,或者由于其他任何原因而无法处理请求,服务网格组件则会根据需要在另一个实例上重试该请求,前提是它知道请求是幂等的;如果实例始终返回错误,服务网格组件会...
    文章 2020-04-08 711浏览量
  • 【内含干货PPT下载】DTCC 2020|阿里云王涛:阿里巴巴...

    3.上云方案选择 —— 网络拓扑图 如下图,最上层是数据库管控平面,下一层是RDS售卖区VPC,用户中心VPC与用户单元VPC之间通过CEN打通,使得全链路打通,这里使用了阿里云产品支撑整个云上架构。在云下,支持用户自建...
    文章 2021-01-06 2034浏览量
  • 历年双11实战经历者:我们是如何做数据库性能优化及运...

    TCPRT全链路系统对用户所有节点上的网络包进行实时分析并绘制出网络拓扑,可以追溯到每段链路上每条用户链接任意每秒的延迟、丢包率、流量、异常等指标。通过可视化用户的真实链路拓扑,我们可以在排查问题时,很容易...
    文章 2017-09-07 9973浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    节点宕机:其中某个节点宕机,其任务转移到其它节点,因为有虚拟节点的缘已经故,所以此节点的任务会均衡 ReSharding 到其它节点,那么,集群在任何时候,任务处理都是分片均衡的,如上图 2 中,B 节点宕机,#1、#2 ...
    文章 2020-09-10 724浏览量
  • 轻松玩转全链路监控

    3.缺少高可用保障:开源全链路监控方案并没有完整的高可用机制,当某个组件出现故障,比如服务器宕机的时候,无法自动恢复,需要人工介入进行解决,在这个过程中正常的监控会受到影响。4.无法支撑大规模场景:当接入...
    文章 2020-11-24 5558浏览量
  • 智能运维——《应用智能运维实践(试读版)》

    这说明应用软件的用户体验下降或宕机将直接导致用户流失&xff0c;当前企业经营运转比以往更依赖应用软件。除此之外&xff0c;近年来新技术、新需求的涌现促使企业拥有的应用规模和复杂度快速膨胀&xff0c;企业原有的IT运维...
    文章 2021-07-06 307浏览量
  • 国内外公有云对比:功能介绍、性能测试

    虚拟机的管理界面比较简单,具有基本的虚拟机、磁盘、快照、镜像管理功能。虚拟机支持启动停止、修改密码。网络部分的功能十分欠缺 阿里云的磁盘支持快照,可以从快照回滚。不过不能从快照创建新的磁盘。另外,一个...
    文章 2020-05-11 2564浏览量
  • 全方位 Logtail 状态监控

    网络:除了网络链路物理上失效的情况以外,对于存在防火墙的网络拓扑,如果防火墙策略发生不当变更,同样可能导致这一条件被破坏。鉴权:一般会在自动化运维时遇到此问题,简单举个例子:自动化运维配置了通过 API ...
    文章 2019-02-25 7506浏览量
  • 企业级自动化运维工具方案设计

    自动化运维是基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发现性能超标,超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助运维...
    文章 2019-12-13 1989浏览量
  • 高可用之2——存储b

    曾经碰到过这样的问题,比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个lun给两个主机,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后...
    文章 2012-06-02 1340浏览量
  • mysql AB复制搭建以及常见故障排查

    5.mysql异常宕机情况下,如果未设置sync_binlog=1或者innodb_flush_log_at_trx_commit=1很有可能出现binlog或者relaylog文件出现损坏,导致主从不一致。6.mysql本身的bug引起的主从不同步。7.版本不一致,特别是高...
    文章 2017-11-14 1415浏览量
  • 读《SRE:Google运维解密》一点思考

    SRE在Google不负责某个服务的上线、部署,SRE主要是保障服务的可靠性和性能,同时负责数据中资源分配,为重要服务预留资源,SRE并不负责某个业务逻辑的具体编写,主要负责在服务出现宕机等紧急事故时,可以快速作出...
    文章 2019-12-16 2881浏览量
  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    高可用性即在硬件出问题时保证虚拟机的正常工作,当然如果真的出错了,则只能在不同的ESXi主机上启动虚拟机,这也可能造成服务的中断。FT(容错)的主要功能就是保证在出现故障时用户的应用不会出现中断。其原理就是...
    文章 2019-10-31 2748浏览量
  • 初识Nginx

    Nginx 支持的负载均衡调度算法方式如下:①weight 轮询(默认):接收到的请求按照顺序逐一分配到不同的后端服务器,即使在使用过程中,某一台后端服务器宕机,Nginx 会自动将该服务器剔除出队列,请求受理情况不会...
    文章 2020-04-30 819浏览量
  • 带你读《存储漫谈Ceph原理与实践》第二章Ceph 架构2.3...

    我们先看一下PG状态机的主要事件定义&xff0c;见表2-2。表2-2 PG状态机 ActivatingPeering 已经完成&xff0c;PG 正在等待所有 PG 实例同步并固化 Peering 的结果&xff08;Info、log等&xff09;Active活跃态。PG ...
    文章 2021-10-18 1浏览量
  • 一文了解EPaxos核心协议流程

    EPaxos总是先本地持久化成功之后再广播给其它副本,这样可以减小Fast Quorum,但也导致本地持久化与网络消息收发不能并行进行,降低了一些效率,同时也使得提议者不能容忍本地磁盘损坏的情况,这些都是EPaxos工程...
    文章 2021-07-07 3982浏览量
  • Mysql 12 复制1

    高可用性 避免单点失败,可以很快的切换到备库,缩短宕机时间 升级测试,用高版本作为备库,可以看看能否按照预期执行。复制如何工作 主库事务提交时记录事件到二进制日志中 备库启动I/O线程去连接主库,主库启动...
    文章 2015-08-19 1317浏览量
  • MySQL·引擎特性·基于InnoDB的物理复制

    首先最重要的原因就是性能!当我们事先了物理复制后,就可以关闭binlog和gtid,大大减少了数据写盘量。这种情况下,最多只需要一次fsync既可以将事务持久化到磁盘。实例整体的吞吐量和响应时间都得到了非常大的提升...
    文章 2016-05-19 6259浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化