• 最近分布式系统开发小结:Slave模块Executors设计

    Executor本身的失败和重启则由Mesos保障,Mesos作为资源管理系统,由Master监控Slave上各个Executor的执行状况,通过回调,可以在合适的Slave上再次启动挂掉的Executor进程,保证业务Task的顺利进行。(全文完)
    文章 2014-01-07 1480浏览量
  • Linux之HA高可用集群的基础概念总结

    首先每个节点要装Messager Layer和CRM节点之间进行heartbeat等信息传输时都因该采取加密传输(如进行hash运算),如果有两个节点可以进行单播传输heartbeat信息,两个以上节点可以进行单播、组播、广播传输heartbeat...
    文章 2017-05-02 1407浏览量
  • 高可用之裂脑问题

    两个节点互相认为对方已挂掉,然后开始争抢共享资源,结果会导致系统混乱,数据损坏。这就是脑裂问题。怎么产生的呢?高可用服务器之间心跳线链路故障,导致无法正常通信。心跳线坏了(包括断了,老化)。网卡即相关...
    文章 2018-08-04 750浏览量
  • nginx技术(3)反向代理和负载均衡

    在其它的均衡器(lvs/haproxy/apache等)里,每个请求都是只有一次机会的,假如用 户发起一个请求,结果该请求分到的后台服务器刚好挂掉了,那么这个请求就失败了;而nginx因为是异步的,所以这个请求可以重新发往下...
    文章 2017-11-07 879浏览量
  • 第一章 概述

    对服务器,而不是对客户进行分类的原因是因为对于一个客户来说,它通常并不能够辨别自己是与一个重复服务器或是并发服务器进行对话。一般来说,TCP服务器是并发的,而UDP服务器是重复的。但也存在一些例外。六 端口...
    文章 2014-10-10 723浏览量
  • 带你读《物联网之魂:物联网协议与物联网操作系统》之...

    同时数字通信系统还能够适应各种类型的业务要求,例如电话、电报、图像及数据传输等,它的普及应用也方便实现统一的综合业务数字网,便于采用大规模集成电路,便于实现信息传输的保密处理,便于实现计算机通信网的...
    文章 2019-11-12 936浏览量
  • 消息中间件面试题31道RabbitMQ+ActiveMQ+Kafka

    答:用于保证当镜像 queue 中 master 挂掉时,连接到 slave 上的 consumer 可以收到自身 consume 被取消的通知,进而可以重新执行 consume 动作从新选出的 master 出获得消息。若不采用该机制,连接到 slave 上的 ...
    文章 2019-07-26 3004浏览量
  • 案例分享:巧用工具提升无源码系统的性能和稳定

    修改源码打印耗时的方法无法使用,通过tcpdump、wireshark、gdb、010 editor、火焰图、ida、数据库抓sql耗时语句、oracle ash报告、loadrunner等工具找到了服务器tps上不去、C程序进程随机挂掉的问题,并顺利解决,...
    文章 2019-08-01 919浏览量
  • 转 Kafka设计理念浅析

    又由于这一层缓存操作是在OS级的,也就意味着即便Kafka挂掉了重启,缓存也不会失效。减少JVM的GC触发。JVM中的对象会占用除实际数据外的较多空间(如类的信息等等),结构不够紧凑,浪费空间。而当内存中维护的消息...
    文章 2016-05-13 2345浏览量
  • 阿里云HBase SQL(Phoenix)服务深度解读

    将数据缓存在客户端,commit时将批量数据发到QueryServer并直接写入HBase,在这一阶段减少了轻客户端到QueryServer的RPC请求次数,并避免缓存在QueryServer的数据在未提交前由于服务挂掉而丢失。优化后在代码写入...
    文章 2019-05-21 9837浏览量
  • Hadoop实战-part2 Hadoop 2.0

    注:ES,Solr,MMP要部署在不同的集群,这三类都需要资源,资源抢占会造成一个DN挂掉,所有Server都会挂掉。HBase和Spark也建议不要搭在一块,资源抢占严重 如果框架需要内存,则不要部署在同一个集群内。书籍推荐1....
    文章 2021-09-01 35浏览量
  • RPC框架Dubbo深入分析

    图中的Consumer和Provider是抽象概念,只是想让看图者更直观的了解哪些类分属于客户端与服务器端,不用Client和Server的原因是Dubbo在很多场景下都使用Provider,Consumer,Registry,Monitor划分逻辑拓普节点,保持...
    文章 1970-01-01 2156浏览量
  • 【双11背后的技术】万亿交易量级下的秒级监控

    监督主要通过监听Terminated事件实现,Terminated事件会在下游挂掉(不论是该协程挂掉还是所在的机器挂掉或是断网等)的时候发送给上游。由于拓扑是提前生成好且具备完备的描述信息,因此每个角色都可以根据拓扑的信息...
    文章 2017-01-12 5487浏览量
  • 阿里李运华:异地多活有哪些Impossible Mission?

    虽然我们无法做到100%可用性,但并不意味着我们什么都不能做,除了抓紧时间恢复业务恢复数据外,为了让用户心里更好受一些,我们可以采取一些措施进行安抚或者补偿,例如:安抚、公告(“技术哥哥正在紧急处理”)...
    文章 2016-11-29 6223浏览量
  • 关于Redis的几件小事|高并发和高可用

    关于Redis的几件小事|高并发和高可用如果你用redis缓存技术的话,肯定要考虑如何用redis来加多台机器,保证redis是高并发的,还有就是如何让Redis保证自己不是挂掉以后就直接死掉了。redis高并发:主从架构,一主多...
    文章 2019-07-23 972浏览量
  • 前端通信:ajax设计方案(二)-集成轮询技术

    长轮询:不停的向后台请求数据,但是后台如果检测不到数据变动,就会将这个请求挂掉。如果检测到数据变动,就会响应这个请求变动数据 区别概念: 长连接:在进行http数据传输的时候,在数据传输层一直开着一个TCP...
    文章 2016-12-07 1009浏览量
  • 对Redis分布式锁的一点错误理解

    在每个实例中设置 key 的时候,客户端会设置一个超时时间,这个超时时间应该小于锁的有效时间,以防节点已经挂掉。例如锁有效时间为 10 秒,则超时时间应该在 5-50 毫秒之间。3.客户端通过从当前时间中减去在步骤 1 ...
    文章 2020-04-21 509浏览量
  • 消息队列入门(一)关于消息队列

    消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别...
    文章 2016-05-05 2435浏览量
  • 如何健壮你的后端服务?

    比如我们做个性化推荐服务时,需要从用户中心获取用户的个性化数据,以便代入到模型里进行打分排序,但如果用户中心服务挂掉,我们获取不到数据了,那么就不推荐了?显然不行,我们可以在cache里放置一份热门商品...
    文章 2015-12-04 5477浏览量
  • 一致性协议浅析:从逻辑时钟到Raft

    ZAB在做log复制时,两阶段提交时,一个阶段是投票阶段,只要收到过半数的同意票就可以,这个阶段并不会真正把数据传输给follower,实际作用是保证当时有超过半数的机器是没有挂掉,或者在同一个网络分区里的。...
    文章 2019-02-18 2404浏览量
  • 为什么需要消息队列,及使用消息队列的好处?

    但是很可惜,十年前开始流行的C10K说法就是在讲:并发量上来之后,会造成chain reaction,大量的并发不会直接挂掉你的mysql节点,但是会拖慢速度,降低吞吐量,一个玩家的请求由于处理时间太长,导致玩家放弃重试,...
    文章 2018-07-05 7618浏览量
  • AIX的topas命令详解(原创)

    如果该数值持续增长,系统一定会挂掉的!空闲百分比当前未使用的调页空间所占的总百分比。NFS 显示每秒调用的 NFS 状态 服务器 V2 calls/sec 客户机 V2 calls/sec 服务器 V3 calls/sec 客户机 V3 calls/sec CPU 使用...
    文章 2016-05-24 1607浏览量
  • 三年java经验面试总结,整理了一些java面试题供参考

    redis可以定期保存到磁盘(持久化)7、灾难恢复-memcache挂掉后,数据不可恢复;redis数据丢失后可以通过aof恢复8、Redis支持数据的备份,即master-slave模式的数据备份。项目使用选择: redis是单线程实现,若需要...
    文章 2019-08-23 1844浏览量
  • 分析网络超时问题的最佳实践

    从形式看都属于网络超时这一类,但是需要明确一个概念:这类问题是发生的原因是请求超过了设定的timeout时间,这个设置有可能来自客户端,服务器端或者网络中间节点,这是直接原因。网络丢包可能会导致超时,但是并...
    文章 2019-05-13 7120浏览量
  • 分析网络超时问题的最佳实践

    从形式看都属于网络超时这一类,但是需要明确一个概念:这类问题是发生的原因是请求超过了设定的timeout时间,这个设置有可能来自客户端,服务器端或者网络中间节点,这是直接原因。网络丢包可能会导致超时,但是并...
    文章 2020-03-31 229浏览量
  • 采用canal搭建MySQL到ES数据传输通道

    t find start position for example原因:meta.dat 中保存的位点信息和数据库的位点信息不一致&xff1b;导致canal抓取不到数据库的动作&xff1b;解决方案&xff1a;删除meta.dat删除&xff0c;再重启canal&xff0c;问题解决&xff1b...
    文章 2021-06-29 117浏览量
  • 一文看懂 kafka 机制

    ISR中有f+1个节点,就可以允许在f个节点down掉的情况下不会丢失消息并正常提供服。ISR的成员是动态的,如果一个节点被淘汰了,当它重新达到“同步中”的状态时,他可以重新加入ISR,这种leader的选择方式是非常快速...
    文章 2018-07-09 7665浏览量
  • aix topas

    操作系统的最全面动态,而又查看方便的性能视图就是topas命令了,下面以topas输出为例,对AIX系统的性能监控做简要描述,供运维工程师和系统管理员们参考。...如果该数值持续增长,系统一定会挂掉的
    文章 2011-01-18 1390浏览量
  • 【译】Linux概念架构的理解

    memory manager依赖于VFS,因为要支持swapping,可以将暂时不运行的进程换出到磁盘上的swap分区,进入起状态。四、高度模块化设计的系统,利于分工合作。只有极少数的程序员需要横跨多个模块开展工作,这种情况...
    文章 2016-06-07 1398浏览量
  • Linux 概念架构的理解

    内存管理器依赖于 VFS,因为要支持交换swapping,可以将暂时不运行的进程换出到磁盘上的交换分区swap,进入起状态。四、高度模块化设计的系统,利于分工合作。只有极少数的程序员需要横跨多个模块开展工作,这种...
    文章 2017-05-02 1278浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化