• 最近分布式系统开发小结:Slave模块Executors设计

    Executor本身的失败和重启则由Mesos保障,Mesos作为资源管理系统,由Master监控Slave上各个Executor的执行状况,通过回调,可以在合适的Slave上再次启动挂掉的Executor进程,保证业务Task的顺利进行。(全文完)
    文章 2014-01-07 1493浏览量
  • Linux 概念架构的理解

    四、高度模块化设计的系统,利于分工合作。只有极少数的程序员需要横跨多个模块开展工作,这种情况确实会发生,仅发生在当前系统需要依赖另一个子系统时;硬件设备驱动(hardware device drivers)、文件系统模块...
    文章 2017-08-01 1355浏览量
  • 【译】Linux概念架构的理解

    四、高度模块化设计的系统,利于分工合作。只有极少数的程序员需要横跨多个模块开展工作,这种情况确实会发生,仅发生在当前系统需要依赖另一个子系统时;硬件设备驱动(hardware device drivers)、文件系统模块...
    文章 2016-06-07 1403浏览量
  • Linux 概念架构的理解

    四、高度模块化设计的系统,利于分工合作。只有极少数的程序员需要横跨多个模块开展工作,这种情况确实会发生,仅发生在当前系统需要依赖另一个子系统时;硬件设备驱动hardware device drivers、文件系统模块logical...
    文章 2017-05-02 1284浏览量
  • DockOne微信分享(一四四):BizCloud:基于...

    Nginx会实时从服务管理中心获取服务对应关系,动态加载Nginx配置,将已经挂掉的Pod1从Nginx中摘除,新增加的PodN暴露给外部。而SOA服务的角色分为两种,一种是consumer,一种是provider。consumer和provider之间的...
    文章 2017-10-10 2309浏览量
  • 如何才能加深对Linux概念架构的理解

    四、高度模块化设计的系统,利于分工合作 只有极少数的程序员需要横跨多个模块开展工作,这种情况确实会发生,仅发生在当前系统需要依赖另一个子系统时。硬件设备驱动hardware device drivers、文件系统模块logical ...
    文章 2017-08-15 1210浏览量
  • 为什么需要消息队列,及使用消息队列的好处?

    但是很可惜,十年前开始流行的C10K说法就是在讲:并发量上来之后,会造成chain reaction,大量的并发不会直接挂掉你的mysql节点,但是会拖慢速度,降低吞吐量,一个玩家的请求由于处理时间太长,导致玩家放弃重试,...
    文章 2018-07-05 7639浏览量
  • DockOne微信分享(一零八):基于Jenkins和Kubernetes...

    Q:容器后发布也要通过Jenkins,感觉Docker的发布没有Jenkins方便,除了容器的可移植,还有什么原因值得推进项目容器?A:应用容器,其实更多的是看重应用在容器管理平台上运行起来后所获得的能力,例如在...
    文章 2017-10-12 2613浏览量
  • ApsaraDB-HBase双集群和稳定性

    (1)支持强同步复制:保证主备集群写入强一致同步,一旦主集群挂掉了,可以在备份上读到最全的数据;(2)对同步和异步做到了同存:同步复制表不影响异步复制表的读写;(3)灵活切换模式:当主集群挂了或者异步集群...
    文章 2018-01-30 8351浏览量
  • nodejs源码—初始

    SIGPIPE信号出现的情况一般在socket收到RST packet之后,扔向这个socket写数据时产生,简单来说就是client想server发请求,但是这时候client已经挂掉,这时候就会产生SIGPIPE信号,产生这个信号会使server端挂掉,...
    文章 2018-10-07 1094浏览量
  • Sharing A Powerful Tool For Application Auto ...

    记得当时写这个程序的直接原因就是,做数据统计结转迁移备份之类的后台定时windows任务实在太多,而且由于历史原因,服务挂掉了也没有人及时知道,最终都会造成用户投诉,但很久才反馈到开发这边,或者用户根本不...
    文章 2017-11-08 870浏览量
  • PolarDB-X 一致性共识协议(X-Paxos)

    在现实应用场景中,Follower 和 Leader 的状态机难免会存在回放延迟,比如一个大的 DDL 会导致 Follower 的回放延迟被无限放大,而如果在回放延迟存在的情况下 Leader 挂掉新主选出时,新主无法对外提供服务,而此时...
    文章 2021-01-18 960浏览量
  • 云原生必备知识:Kubernetes

    一旦一个Pod被创建,系统就会不停的监控Pod的健康情况以及Pod所在主机的健康情况,如果这个Pod因为软件原因挂掉了或者所在的机器挂掉了,replication controller 会自动在一个健康的机器上创建一个一摸一样的Pod,来...
    文章 2020-02-20 162浏览量
  • Node.js之异常处理

    后来接触到Node.js web开发框架后感觉也不是那么轻易就让整个进程都挂掉的,于是便想研究下Node.js究竟是如何来处理各种异常从而避免整个进程挂掉的。当我们的程序运行在Node.js进程里不小心抛出一个异常时便会触发...
    文章 2016-01-20 2937浏览量
  • 常见消息队列基础知识

    大量的并发不会直接挂掉你的mysql节点&xff0c;但是会拖慢速度&xff0c;降低吞吐量&xff0c;一个玩家的请求由于处理时间太长&xff0c;导致玩家放弃重试&xff0c;但是对于后端来说&xff0c;对该玩家之前的处理过程消耗的资源就...
    文章 2021-09-10 62浏览量
  • 热门问题:MNS队列消息计数实现难点浅析

    而Message Server在恢复之后,会将Meta管理节点中持久的计数数据load到本地的内存中,这样也是造成计数无法做到准确的重要原因。(图1) 2.过期消息 在MNS中,队列中消息是有过期时间的,如果长时间消息未消费,...
    文章 2015-12-12 3693浏览量
  • 高可用系统常用解决手段浅述

    出现系统不可用的原因,一种是人为的,比如发布了有 bug 的代码、不规范的发布流程导致的宕机或者网站访问量过载造成的雪崩等;另一种则是非人为的,由于外部系统和环境的变化造成的,比如硬盘老化造成的故障、机房...
    文章 2017-05-23 1487浏览量
  • 号称史上最晦涩的算法Paxos,如何变得平易近人?

    由于应用在多地的部署往往是非对称的原因,才出现单个region全的时候,写需要将主节点切到特定的region内。这些需求都需要Paxos在选主的时候,可以由用户指定规则,而经典理论中同样没有类似的功能,添加权重也...
    文章 2017-08-03 15067浏览量
  • Linux内核配置文档!(make menuconfig)

    模块化使核心变的更简捷,它减少核心释放大量的受保护的空间。模块的安装和卸载使用的空间是可重复分配利用的。如果你打开机器有90%以上的时间用到一个模块,编译它。运用这类模块是浪费内存原因是一旦你编译了...
    文章 2021-11-02 31浏览量
  • 日志系统之基于Zookeeper的分布式协同设计

    临时:当一个工作者线程挂掉之后,它本地的Zookeeper会话也会随之失效,在其会话失效之后,临时节点将会消失。顺序:它能仲裁出创建path的客户端的先后顺序,并在新建的path中追加标识 各个工作者线程创建临时顺序的...
    文章 2017-11-21 1053浏览量
  • 阿里万亿交易量级下的秒级监控

    这里面存在很多可能会出问题的点,因为集群非常庞大,跑着跑着机器可能就挂掉了,这对我们来说是很正常的,一天挂掉十几台机器也是常有的事。下面说一下怎么解决可靠性的问题。1.6、关键点 上面架构有两个关键点: ...
    文章 2017-12-07 5997浏览量
  • 当红架构Cloud Native,怎么搭建才能成为上云助攻手?

    如果项目发展起来,遇到的第一个问题通常是数据库会挂掉,所以在业务初期就做分库分表是很有必要的;选择事务支持更好的数据库,如果你用缺乏事务支持的数据库做业务的后端,当你要做服务拆分或分布式事务的时候,...
    文章 2017-05-16 2317浏览量
  • Hbase问题汇总与解答

    一个常问的问题就是Master挂掉的时候,Hbase会发生什么事情,因为Hbase客户端是直接和RegionServer进行通信,而且hbase:meta表并没有存在Master节点上,Master只是进行RegionServer的故障恢复和Region的切分,因此在...
    文章 2019-01-31 193738浏览量
  • 写自己的缓存框架,JAD-CACHE架构设计篇

    比如,当memcache服务器挂掉时,我们通过它对应的CacheClinet实例改变这个实例管理的所有Cache的状态,停用它,从而达到从应用层上禁用或启用缓存的目地。CacheClient相关的类图如下: 图:CacheClient相关类图 上图...
    文章 2017-08-01 1225浏览量
  • 华为实施微服务架构的五大军规

    随着业务特别是互联网的发展,业务规模的扩大,模块化逐步成为一种趋势,此时解决模块之间远程调用的RPC框架应运而生。RPC需要解决模块之间跨进程通信的问题,不同的团队开发不同的模块,通过一个RPC框架实现远程...
    文章 2017-11-27 1342浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    于是我们想到了 Etcd 方案,即通过它实现同步业务服务列表持久+业务服务列表增减的通知+同步服务器挂掉后 ReHash 通知。至此方案最终确定,即两个注册中心(Eureka 和 Nacos)的双向同步方案,通过 Etcd 来做桥梁...
    文章 2020-09-10 767浏览量
  • ElasticDL:蚂蚁金服开源基于TensorFlow的弹性分布式...

    “但是 TensorFlow runtime 应该是平台无关的,所以不应该包含访问特定集群管理系统,请它重启挂掉的进程的代码,所以不易实现弹性调度”,王益指出了二者的区别:“与之相对应的,通过调用 TensorFlow API 实现分布...
    文章 2019-09-11 974浏览量
  • TCP连接和 time_wait、close_waite

    引言:前两天朋友公司的服务器垮了,最后查出的原因是发现大量的time_wait网络状态。被问起来time_wait是什么,当时就简单的给解释了两句,后来想想正好博客没有特别好的话题,拿来写一下也很不错。简单的描述产生...
    文章 2018-05-16 1281浏览量
  • 阿里搜索事业部故障快速恢复实践

    第一种处理方法已经在实践中越来越少的出现,因为现在大原则是先恢复后查问题,除非出现多个机房同时挂掉的情况,否则不是首选。第三种看起来也是一个不错的方向,不过在实践中这个方案的要求极高,需要系统具备:...
    文章 2018-03-16 2697浏览量
  • 去哪儿网基于Mesos和Docker构建私有云服务实践

    框架本身不能重注册,如果框架跑到一半挂掉了,重启之后之前的任务就直接忽略不管,需要手工Kill掉这个框架。不能动态扩容executor。最后是不能扩容、动态调整,临时改动的话只能重发任务。整个过程比较简单,如下图...
    文章 2017-10-02 1507浏览量
1 2 3 4 ... 13 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化