• 走近华佗,解析自动化故障处理系统背后的秘密

    一旦有问题,第一时间定位是最关键的,华佗的引入使得网络故障定位由原来的小时级别降低到分钟级别。总结 由于故障的处理和平台及业务密切相关,所以这里只是介绍了华佗通用的一面,只是冰山一角。具体各种故障处理...
    文章 2016-12-18 4655浏览量
  • 计算机网络通信中的数据链路层

    检测链接状态——要有一种机制来检测链路的状态,比如一段链路出现发生故障,要过多长时间重新发送。最大传送单元(MTU) 网路地址协商——要有一种机制能确保两个实体知道彼此的网络层地址 数据压缩协商——传送的...
    文章 2018-11-02 1086浏览量
  • 分布式事务及其一致性协议

    (3)分区容错性:分布式系统在遇到任何网络分区故障时,都需要能够保证一致性和可用性,除非整个网络发生故障。2.BASE理论 BASE理论指的是Basically Avaliable(基本可用)、Soft state(软状态)和Eventually ...
    文章 1970-01-01 571浏览量
  • 网络基本功系列:细说路由(下)

    动态路由协议的一大好处在于当拓扑变更时,路由器会交换路由信息,从而能够自动学习新增网络,并且在链路故障时,找到替换路径。路由协议完成这一功能的方式取决于它所使用的算法以及此协议的操作特性。通常来说,...
    文章 2014-12-01 1528浏览量
  • 信息系统项目管理01——信息化和信息系统

    (2)MMTR——平均维护时间,可维护性用此度量,这是系统发生故障后维修和恢复正常花费的平均时间。1.4 软件工程 1 需求 1 好的需求应该具有无二义性、完整性、一致性、可测试性、确定性、可跟踪性、正确性、必要性...
    文章 2020-12-11 115浏览量
  • 带你读《物联网之魂:物联网协议与物联网操作系统》之...

    它在其他6层工作的基础上,负责完成网络中应用程序与网络操作系统之间的联系,建立与结束使用者之间的联系,并完成网络用户提出的各种网络服务及应用所需的监督、管理和服务等各种协议。此外,该层还负责协调各个...
    文章 2019-11-12 900浏览量
  • 利用SQL SERVER 2005数据库镜像实现可用性

    至于UNDO的操作,在用户使用的过程中你再继续UNDO,所以当主体服务器发生数据更新了,镜像服务器会以最短的时候来时间更新,以至于如果主体数据发生故障了,镜像服务器右以在最短的时间内接替主服务器进行工作。...
    文章 2017-11-14 1033浏览量
  • 带你读《计算机网络问题与解决方案:一种构建弹性现代...

    首先,可以设计一个允许新旧版本重叠的协议(或多个协议),或者是这些协议可以在同一网络上同时运行。这种方案有时被称为“午夜航船”:新旧协议(或相同协议的不同版本)独立运行,互不干扰。其次,可以选择特定的...
    文章 2019-11-07 544浏览量
  • 车联网上云最佳实践(二)

    我们公司运维大部分时间还是处于人肉运维,脚本运维时代,运维自动化程度低,原因一是公司业务发展太快,运维人员每天大部分时间不是在处理应用升级就是在解决系统故障,根本没有时间去做运维自动的工作。...
    文章 2018-08-22 2561浏览量
  • Winform文件下载之断点续传

    当我们在下载文件的过程中,由于网络故障等原因中断了下载过程,这时如果服务器上的文件已经变化了,那么无论如何都需要重新从头开始下载,只有当服务器上的文件没有发生变化的情况下,断点续传才有意义。...
    文章 2016-06-13 775浏览量
  • 秘诀!支付宝支撑双十一4200万次/秒的数据库请求峰值...

    在节点角色上,有几个节点(root service)负责管理集群拓扑结构等全局信息,相对特殊一点,但每个节点都具备承担这个角色的能力,如果当前承担该角色的节点发生故障,集群会自动选举出新的节点承担这个角色。...
    文章 2018-05-10 2640浏览量
  • 数据一致性-分区可用性-性能—多副本强同步数据库系统...

    但是,如果不是主库Crash,而是网络发生了一些问题,如下图所示: 若Master与Slave之间的网络出现问题,例如:断网,网络抖动等。此时数据库应该怎么办?Master继续提供服务?Slave没有同步日志,会数据丢失。Master...
    文章 2017-01-11 4425浏览量
  • Winform文件下载之断点续传

    当我们在下载文件的过程中,由于网络故障等原因中断了下载过程,这时如果服务器上的文件已经变化了,那么无论如何都需要重新从头开始下载,只有当服务器上的文件没有发生变化的情况下,断点续传才有意义。...
    文章 2017-11-21 970浏览量
  • Windows2003配置集群详解

    提示:为共享磁盘分配驱动器卷标至关重要,因为在还原磁盘时这会大大减少故障排除时间。四、创建集群 通过以上准备工作后,即可开始集群的创建。操作步骤如下所示: 步骤1:依次单击“开始/程序/管理工具/群集管理器...
    文章 2015-12-09 606浏览量
  • 年轻人不讲武德,偷袭阿里的机房

    总会有各种原因和各种理由让一台服务器发生故障的,可能是过载了,可能是老鼠咬线了,可能是冷凝液泄露了,甚至可能是被知乎用户派人炸了。知乎上有人问过一个问题,如果阿里云数据中心崩了或者被人炸了,是不是淘宝...
    文章 2020-11-18 4520浏览量
  • 车联网上云最佳实践(一)

    这一块我们目前遇到瓶颈是在IDC网络带宽扩容上,目前我们IDC机房如果对需要对网络带宽扩容需要提申请报备,内部走流程做完在到运营商那里走流程,时间往往比较长,最快也要1-2天,无法及对网络带宽做到快速扩容,...
    文章 2018-08-31 2919浏览量
  • 高可用之2——存储b

    网络存储通信中使用到的相关技术和协议包括SCSI、RAID、iSCSI以及光纤信道。一直以来SCSI支持高速、可靠的数据存储。RAID(独立磁盘冗余阵列)指的是一组标准,提供改进的性能和/或磁盘容错能力。光纤信道是一种提供...
    文章 2012-06-02 1326浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    TChannel—RPC网络复用和成帧协议 Thrift 概述 Uber 是一个连接类似乘客和司机关系的应用程序。挑战:实时搭建一个动态的需求和供应系统。在供应方,司机可以自由的做他们想做的事。在需求方,乘客可以去任何他们想...
    文章 2017-11-20 1711浏览量
  • 如何在 5 分钟内读懂区块链的架构思维?

    而是通过P2P协议进行节点之间的数据传输,任何节点都可以随时加入或者离开比特币网络集群,而不会对比特币网络集群产生影响,也不需要特意去修复这个集群中的故障机器。利用P2P协议进行节点之间数据传输主要有两个...
    文章 2018-04-16 1094浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    TChannel—RPC网络复用和成帧协议 Thrift 概述 Uber 是一个连接类似乘客和司机关系的应用程序。挑战:实时搭建一个动态的需求和供应系统。在供应方,司机可以自由的做他们想做的事。在需求方,乘客可以去任何他们想...
    文章 2016-03-17 3505浏览量
  • 分布式系统数据层设计模式

    表示能容忍的从故障发生到系统恢复正常运转的时间,这个时间越短,容灾要求越高。RPO,Recovery Point Objective,数据恢复点目标。表示能容忍故障造成过去多长时间的数据丢失,RPO 为 0 表示不允许数据丢失。分布式...
    文章 2019-08-03 718浏览量
  • 最全技术面试180题:阿里11面试+网易+百度+美团!

    12.网络层:单位是数据帧,协议有IP 13.网络接口层:单位是比特,ARP、RARP 14.三次握手与四次挥手 15.BIO NIO AIO 16.BIO:同步阻塞IO,每个请求都要一个线程来处理。17.NIO:同步非阻塞IO,一个线程可以处理多个...
    文章 2018-11-05 1124浏览量
  • 如何用架构师思维解读区块链技术?

    而是通过P2P协议进行节点之间的数据传输,任何节点都可以随时加入或者离开比特币网络集群,而不会对比特币网络集群产生影响,也不需要特意去修复这个集群中的故障机器。利用P2P协议进行节点之间数据传输主要有两个...
    文章 2018-04-16 1084浏览量
  • 如何改变Redis用不好的误区

    在这段时间里,我们开发了多种同步工具,几乎把Redis的主从协议整个实现了一遍,终于可以将Redis平滑过渡到新的模式上了。原文发布时间为:2017-12-20 本文作者:王晓波 本文来自云栖社区合作伙伴“中生代技术”,...
    文章 2017-12-20 5000浏览量
  • HBase设计的实践经验(全)——《我的Java打怪日记》

    当某个 Region Server 发生 crash 时,它所管理的 region 就无法被访问了,直到 crash 被检测到,然后故障恢复完成,这些 region 才能恢复访问。Zookeeper 依靠心跳检测发现节点故障,然后 HMaster 会收到 region ...
    文章 2021-07-27 43050浏览量
  • Redis夺命连环11问

    此时将会发生故障转移,优先从复制数据较多的从节点选择一个成为主节点,并且接管下线节点的slot,整个过程和哨兵非常类似,都是基于Raft协议做选举。了解Redis事务机制吗?redis通过MULTI、EXEC、WATCH等命令来实现...
    文章 2021-03-05 779浏览量
  • OceanBase数据库创始人阳振坤分享征战6088万tpmC的...

    2000年伊始,随着互联网的发展,业务系统对数据库的需求发生了很大的变化。在过去,传统的数据库并发访问量从几百到几千。进入互联网时代后,并发访问量骤增,达到百万至千万的级别。越来越多的公司发现根据现有的...
    文章 2019-10-23 3886浏览量
  • DBA很忙—MySQL的性能优化及自动化运维实践

    自动化故障切换是发生在单节点发生故障。比如说变更操作,一些Keepalive部署配置,切换脚本,VRRP协议来实现的。也是通过编写一些脚本,那这个脚本可能会定期去检查我们的数据库节点的运行状况。比如说这个VIP有没有...
    文章 2018-11-16 4288浏览量
  • 【杭州云栖】阿里云高级技术专家刘廷伟:全球CDN服务...

    比如节点故障的隔离,如果1500个节点,有1000个节点监测出问题了,怎么办?自动化处理下线修复?那剩下的500个节点就被流量打爆了。一定要给自动化安个熔断器,做到可控的自动化。一个是自动化穷举的问题,你不可能...
    文章 2018-09-21 3847浏览量
  • 阿里云双11访谈之云数据库

    专用网络在底层网络协议层上就已经保证数据不会被在网络之外的用户访问。这是关于底层协议的问题,用户是看不到的,完全透明的,这也是阿里云数据库系统架构上的支持。在保护在云数据库上我们做了高访问安全的访问...
    文章 2017-11-01 6785浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化