• 云原生必备知识:Kubernetes

    一旦一个Pod被创建,系统就会不停的监控Pod的健康情况以及Pod所在主机的健康情况,如果这个Pod因为软件原因挂掉了或者所在的机器挂掉了,replication controller 会自动在一个健康的机器上创建一个一摸一样的Pod,来...
    文章 2020-02-20 150浏览量
  • RPC框架Dubbo深入分析

    图中的Consumer和Provider是抽象概念,只是想让看图者更直观的了解哪些类分属于客户端与服务器端,不用Client和Server的原因是Dubbo在很多场景下都使用Provider,Consumer,Registry,Monitor划分逻辑拓普节点,保持...
    文章 1970-01-01 2159浏览量
  • 《深入浅出DPDK》—第2章2.2节Cache系统简介

    时钟频率达到3.8GHz,数据总线和地址总线也都扩展到了64位,可以寻址的内存大小也已经开始以TB(1T=1024GB)计算。在处理器速度不断增加的形势下,处理器处理数据的能力也得到大大提升。但是,数据是存储在内存中的...
    文章 2017-05-02 1357浏览量
  • 某口罩项目架构演进记录&优化经验分享

    导致老程序刚承接的时候再度挂掉3.5 5号使用这个架构上线,7分钟库存售罄,且体验极度流程,丝般顺滑,健康同学开发的新程序真是太爽的 优点:CDN负担静态资源的流量降低了SLB的出带宽,压测的效果也非常理想缺点:...
    文章 2020-05-26 1289浏览量
  • 解析nginx负载均衡

    实际测试中发现,通用hash和一致性hash均存在一个问题:当某台后端的机器挂掉时,原有落到这台机器上的流量会丢失,但是在ip hash中就不存在这样的问题。正如上文中对ip hash源码的分析,当ip hash失效时,会退化为...
    文章 2012-12-06 1510浏览量
  • 【译】Linux概念架构的理解

    PS:进程上下文切换就是要换程序状态字、换页表基地址寄存器的内容、换current指向的task_struct实例、换PC——>也就换了进程打开的文件(通过task_struct的files可以找到)、换了进程内存的执行空间...
    文章 2016-06-07 1401浏览量
  • Linux 概念架构的理解

    PS:进程上下文切换就是要换程序状态字、换页表基地址寄存器的内容、换 current 指向的 task_struct 实例、换 PC ——>也就换了进程打开的文件(通过 task_struct 的 files 可以找到)、换了进程内存的...
    文章 2017-05-02 1280浏览量
  • VTP 导致的网络故障

    在楼层交换机no 掉down掉的vlan 后重新创建该vlan 后SVI 口的状态为UP。故障分析: 核心交换机VTP模式为transparent不会根据接收到通告信息同步自己的VLAN配置,透明交换机会从中继端口转发所收到的VTP通告,...
    文章 2017-11-27 978浏览量
  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    由于后端分布式一致性服务单元由5台Master机器组成,可以容忍同时2台机器挂掉,因此上述报警均没有发现对服务可用性产生影响。但是,在短时间之内频繁发生单个Master服务进程异常,这个对于服务稳定性是个极大隐患,...
    文章 2019-12-20 151浏览量
  • 云时代下的数据库存储——运筹帷幄的阿里云数据库...

    另外两个备节点依然从主节点上去同步数据,跟之前所不同的是一旦三个机房的其中一个出现了非常严重的自然灾害导致整个机房挂掉之后,MongoDB目前所支持的一个HA高可用系统会直接将应用流量从挂掉的实例切换到另外两...
    文章 2018-01-28 6621浏览量
  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    由于后端分布式一致性服务单元由5台Master机器组成,可以容忍同时2台机器挂掉,因此上述报警均没有发现对服务可用性产生影响。但是,在短时间之内频繁发生单个Master服务进程异常,这个对于服务稳定性是个极大隐患,...
    文章 2019-12-20 1721浏览量
  • 热门问题:MNS队列消息计数实现难点浅析

    MNS是基于阿里云飞天分布式平台上的消息服务,具有高并发、高可扩展等优点,别看大家平常只是向一个URL地址收发消息,但是MNS后端却是多台Message Server为大家提供服务;各个Message Server会将用户发送的消息数据...
    文章 2015-12-12 3680浏览量
  • ElasticDL:蚂蚁金服开源基于TensorFlow的弹性分布式...

    “但是 TensorFlow runtime 应该是平台无关的,所以不应该包含访问特定集群管理系统,请它重启挂掉的进程的代码,所以不易实现弹性调度”,王益指出了二者的区别:“与之相对应的,通过调用 TensorFlow API 实现分布...
    文章 2019-09-11 959浏览量
  • Qunar 高速发展下数据库的创新与发展

    (3)HBase 的软件栈是 Java,JVM 的 GC 是个很头疼的问题,在运维过程中多次出现 RegionServer 因为 GC 挂掉的情况,另外很难通过优化来消除访问延时毛刺,给运维造成了很大的困扰。此外,HBase 在编程语言支持访问对...
    文章 2018-07-14 1962浏览量
  • 案例分享:巧用工具提升无源码系统的性能和稳定

    修改源码打印耗时的方法无法使用,通过tcpdump、wireshark、gdb、010 editor、火焰图、ida、数据库抓sql耗时语句、oracle ash报告、loadrunner等工具找到了服务器tps上不去、C程序进程随机挂掉的问题,并顺利解决,...
    文章 2019-08-01 923浏览量
  • 应用开发实践之关系型数据库(以MySql为例)小结

    主要是一写多读的架构,在主库挂掉的场景下有可能需要考虑使用paxos算法来决定新的主库。在做读写分离前,可以先考虑缓存是否能解决当前场景的问题。五、运维 binlog记录DB操作(不含查询)及其他执行信息的二进制...
    文章 2020-05-05 636浏览量
  • ENode 1.0-框架的总体目标

    那如果断电了,那理论上这100毫秒的数据不是就丢了,没关系,我们还可以同时把数据写入到多台mongodb server,也就是我们可以部署一个MongoDB server的集群,一般整个集群的所有机器都同时挂掉的可能性是很低的,...
    文章 2016-05-27 1592浏览量
  • 我们雇佣了一只大猴子.

    验证核心系统的同城一个机房挂掉的情况下,是否还可以正常工作。2015年因为一次宕机事故,公司内部得出一个结论:任何基础设施、生产系统、任何流程都可能出现问题,没有经过重大灾难验证的容灾设施都是耍流氓。启动...
    文章 2019-02-28 2028浏览量
  • 你真的了解Docker吗?——Docker插件机制详解

    Docker之所以这么火并且有很多人愿意使用它,其中涉及到很多方面的因素,例如功能性以及隔离性等各种各样的原因。其中Docker的开箱即用功能是一个非常具有特色的优点,Docker安装后即可使用,无需再做其他的配置;...
    文章 2016-08-25 10529浏览量
  • Hadoop2.0 Namenode HA实现方案介绍及汇总

    QJM本质上是Paxos算法的实现,通过启动2N+1个JournalNode来写editlog,当其中大于N个Node写成功时候认为本次写成功,且允许容忍N以下个Node挂掉。QJM实现及源码分析可以参考基于QJM的HDFS HA原理及代码分析。QJM和...
    文章 2013-11-05 1608浏览量
  • ofo在MaxCompute的大数据开发之路

    第一,并发,多机多进程,以减少进程挂掉服务器挂掉带来的影响。第二,协作,要求能建立依赖关系。比如先计算完某张表后再计算依赖它的表。第三,可监控,当出现故障时能及时报警。第四,可扩展性,在任务调度中写的...
    文章 2018-06-15 4522浏览量
  • [译]系统设计入门|掘金翻译计划

    A 记录(地址)─指定域名对应的 IP 地址记录。CNAME(规范)─一个域名映射到另一个域名或 CNAME 记录(example.com 指向 www.example.com )或映射到一个 A 记录。CloudFlare 和 Route 53 等平台提供管理 ...
    文章 2017-10-16 1766浏览量
  • 想染指系统架构?你绝对不可错过的一篇

    A 记录(地址)─指定域名对应的 IP 地址记录。CNAME(规范)─一个域名映射到另一个域名或 CNAME 记录(example.com 指向 www.example.com )或映射到一个 A 记录。CloudFlare 和 Route 53 等平台提供管理 ...
    文章 2017-10-17 2243浏览量
  • 网易云基于Kubernetes+Docker的容器服务研发实践

    容器的存储也是比较难解决的问题,多数容器都是无状态的,也就是说容器内部不应该保存用户有用的数据,一个容器挂掉后,用镜像能很快启动另一个容器,保证系统的正常运行。从架构上来说这个设计很好,弹性可扩展。但...
    文章 2017-05-16 3440浏览量
  • nosql和Redis

    灾难恢复-memcache挂掉后,数据不可恢复;redis数据丢失后可以通过aof恢复;7>虚拟内存-Redis当物理内存用完时,可以将一些很久没用到的value 交换到磁盘;8>Redis支持数据的备份,即master-slave模式的数据...
    文章 2017-11-24 1216浏览量
  • Sharing A Powerful Tool For Application Auto ...

    记得当时写这个程序的直接原因就是,做数据统计结转迁移备份之类的后台定时windows任务实在太多,而且由于历史原因,服务挂掉了也没有人及时知道,最终都会造成用户投诉,但很久才反馈到开发这边,或者用户根本不...
    文章 2017-11-08 862浏览量
  • ElasticDL:Kubernetes-native 弹性分布式深度学习系统

    这种“非 Kubernetes-native”的 容错方式颇为被动,只能接受资源紧张时一些进程被抢占而挂掉的事实,而不能 在其他作业释放资源后增加进程充分利用空闲资源。TensorFlow 2.0 如上文解释,为了保证 TensorFlow 最...
    文章 2019-09-12 6227浏览量
  • Net 微服务架构技术栈的那些事

    一旦一个Pod被创建,系统就会不停的监控Pod的健康情况以及Pod所在主机的健康情况,如果这个Pod因为软件原因挂掉了或者所在的机器挂掉了,replication controller 会自动在一个健康的机器上创建一个一摸一样的Pod,来...
    文章 2020-04-08 892浏览量
  • 《CCNP SWITCH 300-115学习指南》——2.1节园区网结构

    在接入层中部署3层交换可以看作是对2层交换的一种扩展,最主要的原因是可以在接入层设备上对VLAN进行终结,而且接入层到分布层交换机之间的所有链路都是路由链路,所有接入层和分布层的设备都能加入到路由进程中。...
    文章 2017-05-02 1831浏览量
  • 流量暴增,掌门教育如何基于 Spring Cloud Alibaba ...

    当一台或者几台同步服务器挂掉后,采用 Zookeeper 临时节点的 Watch 机制监听同步服务器挂掉情况,通知剩余同步服务器执行 reHash,挂掉服务的工作由剩余的同步服务器来承担。通过一致性 Hash 实现被同步的业务服务...
    文章 2020-09-10 733浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化