• 海量数据下的注册中心-SOFARegistry 架构介绍

    SessionServer 集群部署,任何一台 SessionServer 宕机时 Client 会自动 failover 到其他 SessionServer,并且 Client 会拿到最新的 SessionServer 列表,后续不会再连接这台宕机的 SessionServer。数据模型 模型...
    文章 2019-08-01 740浏览量
  • 海量数据下的注册中心-SOFARegistry 架构介绍

    SessionServer 集群部署,任何一台 SessionServer 宕机时 Client 会自动 failover 到其他 SessionServer,并且 Client 会拿到最新的 SessionServer 列表,后续不会再连接这台宕机的 SessionServer。数据模型 模型...
    文章 2019-08-06 2960浏览量
  • 海量数据下的注册中心-SOFARegistry 架构介绍

    SessionServer 集群部署,任何一台 SessionServer 宕机时 Client 会自动 failover 到其他 SessionServer,并且 Client 会拿到最新的 SessionServer 列表,后续不会再连接这台宕机的 SessionServer。数据模型 模型...
    文章 2019-04-26 964浏览量
  • 面对这11道面试题你是否有很问号?

    list 是有序列表,这个可以玩儿花样。比如可以通过 list 存储一些列表型的数据结构,类似粉丝列表、文章的评论列表之类的东西。比如可以通过 lrange 命令,读取某个闭区间内的元素,可以基于 list 实现分页...
    文章 2020-05-06 1345浏览量
  • 读《大型网站技术架构》

    2)服务器越宕机的概率越大 常用的分布式方案: 1)分布式应用和服务;2)分布式静态资源;3)分布式数据和存储;4)分布式计算;5)分布式配置、分布式锁、分布式文件系统。集群,即台服务器部署相同的应用,...
    文章 2017-04-09 972浏览量
  • 《策略驱动型数据中心——ACI技术详解》——第1章 ...

    第一条连接到架顶式(ToR)交换机的电缆在某种意义上讲已属于“矩阵”,因为它承载着从台主机传输到连接的第一台物理网络设备的流量,这台设备是ToR或接入交换机。连接的第一台交换机现在可能会是一台虚拟交换机...
    文章 2017-05-02 2024浏览量
  • 系统稳定性——So Hot?快给 CPU 降降温!

    当 CPU 过于繁忙,就像“人脑”并发处理过多的事情,会降低做事的效率,严重时甚至会导致崩溃“宕机”。因此,理解 CPU 的工作原理,合理控制负载,是保障系统稳定持续运行的重要手段。目录 CPU 的物理核与逻辑核 ...
    文章 2019-08-26 952浏览量
  • 阿里云基础产品技术月刊 2019年3月

    阿里云日志服务是面向日志类数据的智能化一站式平台,针对AIOps场景,新增面向趋势预测、异常发现、智能聚类、根因分析(推导)等4个高频场景系列函数,从异常的识别、分析的过程到最后的原因定位均有涉及,通过这些...
    文章 2019-04-11 4405浏览量
  • kafka

    2.消费者离开当前所属的 consumer group,比如主动停机或者宕机 3.topic 新增了分区(也就是分区数量发生了变化) coordinator 角色来执行 Rebalance 以及管理 group,当 group 中的 consumer 启动的时候,它会去和 ...
    文章 2019-06-09 4246浏览量
  • 浅析数据一致性

      在该过程中可能存在通信失败,例如网络中断、主机宕机等诸多的原因,对于未在算法中定义的其它异常,都认为是提交失败,都需要回滚,这是该算法基于确定的通信回复实现的,在参与者的确定回复(无论是回复失败...
    文章 2016-02-19 1033浏览量
  • 蚂蚁变大象:浅谈常规网站是如何从小变大的

    通过这样的拆分后,我们就迈出了多机的第一步。虽然看起来比较简单和容易,但是这也是非常具有里程碑意义的。这样的优化,可能会提升20-30%左右的一个CPU idle。能够使得我们的网站能够经受更大的压力。【第五阶段...
    文章 2017-11-07 1322浏览量
  • 还在为集群管理烦恼吗?RedHat 和蚂蚁、阿里云给...

    ​etcd 作为分布式系统可以天然解决大部分节点失败的问题,可是不幸的是实践中 etcd 服务也还是可能出现宕机的状况,可能是管理的操作失误,也可能是出现了网路分区。为了防止 etcd 出现问题时“毁灭世界”,往往...
    文章 2021-07-21 766浏览量
  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-02 2245浏览量
  • kafka基本原理

    这样就避免了部分数据被写了leader,还没来得及被任何follower复制就宕机了,而造成数据丢失(consumer无法消费这些数据)。而对于producer而言,它可以选择是否等待消息commit,这可以通过request.required.acks...
    文章 2016-07-12 900浏览量
  • 分布式系统架构,回顾2020年常见面试知识点梳理(每次...

    做冗余,设置个事务管理器,一个掉了,其他的还可以用。问:怎么保证分布式系统的幂等性?状态机制。版本号机制。Redis 问:Redis 有哪些优势?速度快,因为数据存在内存中。支持丰富数据类型,支持 string、...
    文章 2020-12-30 229浏览量
  • 一文详解大规模数据计算处理原理及操作重点

    DataNode会通过心跳和NameNode保持通信,如果DataNode超时未发送心跳,NameNode就会认为这个DataNode已经失效,立即查找这个DataNode上存储的block有哪些,以及这些block还存储在哪些服务器上,随后通知这些服务器再...
    文章 2018-08-08 1605浏览量
  • 还在为集群管理烦恼吗?OCM来啦!

    etcd 作为分布式系统可以天然解决大部分节点失败的问题,可是不幸的是实践中 etcd 服务也还是可能出现宕机的状况,可能是管理的操作失误,也可能是出现了网路分区。为了防止 etcd 出现问题时“毁灭世界”,往往通过...
    文章 2021-07-20 754浏览量
  • Service Mesh 高可用在企业级生产中的实践

    混合微服务出现的原因是为了更好的支持平滑迁移,最大限度的提升服务治理水平,降低运维通信成本等,并且可能会在一个较长的周期存在着。而实现这一架构的前提,就是各服务的“互联互通”。要想实现上述“混合微服务...
    文章 2020-06-03 296浏览量
  • 带你读《跟老男孩学Linux运维:核心基础篇(上)(第2...

    当然,由于服务器的主板的扩展性较强,插槽也多出了若干个,所以外观会比普通主板大一些,因此塔式服务器的主机机箱也比标准的ATX机箱要大,一般都会预留足够的内部空间以便日后进行硬盘和电源的冗余扩展。...
    文章 2019-11-11 1085浏览量
  • 《架构真经:互联网技术架构的设计》大道至简

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-19 3392浏览量
  • 告别“臃肿”,选择微服务(文末福利)

    如图1-4所示,一个微服务系统有很个服务,当服务F因某些原因导致了服务的不可用,来自于用户的网络请求需要调用服务F。由于服务F无响应,用户的请求都处于阻塞状态,在高并发的场景下,短时间内会导致服务器的线程...
    文章 2018-03-23 2964浏览量
  • 分布式一致性算法Raft简介(下)

    原因在于:新leader上任后,可能有些server仍然是宕机状态,新leader没有办法立即对其进行clean up(因为那些server宕机或网络不通,无法进行通讯),只能等到这些server恢复正常后再进行clean up;而新leader不知道...
    文章 2017-03-27 3753浏览量
  • 带你读《Flink原理、实战与性能优化》之一:Apache ...

    在任务执行过程中,能够自动发现事件处理过程中的错误而导致数据不一致的问题,比如:节点宕机、网路传输问题,或是由于用户因为升级或修复问题而导致计算服务重启等。在这些情况下,通过基于分布式快照技术的...
    文章 2019-11-01 5646浏览量
  • 蚂蚁金服服务注册中心数据分片和同步方案详解|...

    传统的一致性 Hash 算法有数据分布范围不固定的特性,该特性使得服务注册数据在服务器节点宕机、下线、扩容之后,需要重新存储排布,这为数据的同步带来了困难。大多数的数据同步操作是利用操作日志记录的内容来进行...
    文章 2019-10-11 586浏览量
  • 超全总结|阿里如何应对电商故障?...

    我相信关注这个问题的人很,不过能给确切答案的人并不。因为这个看似简单的问题,真要回答起来好像也不是那么容易。今天的分享,我先试着给大家回答一下这个问题。让我们从一张“简单”的页面说起。这张页面...
    文章 2017-06-19 3717浏览量
  • Redis进阶实践之十 Redis哨兵集群模式

    有主观宕机,肯定就有客观宕机。当“哨兵群”中的多数Sentinel进程在对Master主服务器做出 SDOWN 的判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,这种方式就是...
    文章 2018-02-13 2828浏览量
  • 面试题有哪些

    ​使用int的原因是,对于当下32位的处理器(CPU)来说,一次处理数据是32位(这里不是指的是32/64位系统,而是指CPU硬件层面),具有高效存取的特点。标识符的命名规则?标识符的含义 是指在程序中,我们自己定义的...
    文章 2021-10-07 14浏览量
  • 在家办公这些天整理的Kafka知识点大全

    Kafka的分区的原因主要就是提供并发提高性能,因为读写是partition为单位读写的;那生产者发送消息是发送到哪个partition中呢?A、在客户端中指定partition B、轮询(推荐)消息1去p1,消息2去p2,消息3去p3,消息4...
    文章 2020-02-19 964浏览量
  • 独家|一文读懂Hadoop(二)HDFS(上)

    如果Namenode在文件关闭前宕机了,则该文件将丢失。上述方法是对在HDFS上运行的目标应用进行认真考虑后得到的结果。这些应用需要进行文件的流式写入。如果不采用客户端缓存,由于网络速度和网络堵塞会对吞估量造成...
    文章 2017-08-01 1490浏览量
  • DataWorks 如何撑起阿里99%的数据开发?

    外部关联服务复杂多变,且不可靠不稳定,随时会宕机或者网络中断,甚至是外部服务升级忘了通知我们,从而导致故障频繁。这一点对于数据集成这样一个在几十种引擎,数千个数据库实例中搬运数据的应用来说尤其深有体会...
    文章 2020-02-26 1347浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化