• OceanBase高可用实践

    分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,...
    文章 2019-07-28 1579浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-24 3432浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-19 2944浏览量
  • 天梭M13为何具有大型水平的高可用性

    RAS特性是主机与一般服务器的主要区别,同时也是主机设计的一个难题,业界产品在技术上普遍具备了超过99.99%的高可用性,但是银行、保险、证券交易所等核心业务系统的宕机事件仍时有发生。100%的可靠是不存在的,但...
    文章 2017-08-02 1424浏览量
  • 五分钟学后端技术:一篇文章告诉你什么是云计算!

    所以一台服务器上的容器是共享操作系统内核的,容器在不同机器之间的迁移不带内核,这也是很多人声称容器是轻量级的虚拟机的原因。轻不白轻,自然隔离性就差了,一个集装箱把船压漏水了,所有的集装箱一起沉。另一个...
    文章 2020-04-02 2512浏览量
  • 带你读《企业私有云建设指南》之二:企业云计算涉及的...

    高可用性即在硬件出问题时保证虚拟机的正常工作,当然如果真的出错了,则只能在不同的ESXi主机上启动虚拟机,这也可能造成服务的中断。FT(容错)的主要功能就是保证在出现故障时用户的应用不会出现中断。其原理就是...
    文章 2019-10-31 2748浏览量
  • 高可用之2——存储b

    曾经碰到过这样的问题,比如有人问,我们有一个磁盘阵列,连到了两个主机上,我们划分了一个lun给两个主机,然后我们想,先在操作系统将磁盘分为两个区,让两个主机分别使用两个分区,然后再出现某一台主机宕机之后...
    文章 2012-06-02 1340浏览量
  • 如何建设移动 DevOps?

    3)高标准的SLA,实时在线,永不宕机高标准SLA既是对客户的承诺,也是对阿里云品牌的敬畏。可扩展性1)应用架构多样化导致的构建流程差异大专有云客户数量有限,而且有完善的KA客户技术支持服务,所以应用的差异有限...
    文章 2020-11-27 1110浏览量
  • EMAS 移动 DevOps 解决方案 —— Mobile DevOps

    高标准的SLA,实时在线,永不宕机高标准SLA既是对客户的承诺,也是对阿里云品牌的敬畏。3)可扩展性 应用架构多样化导致的构建流程差异大专有云客户数量有限,而且有完善的KA客户技术支持服务,所以应用的差异有限且...
    文章 2020-11-27 5881浏览量
  • 智能、互联时代的应用运维——《应用智能运维实践...

    汽车的电子车身稳定装置、加速防滑控制系统、防抱死制动系统、刹车辅助系统等可实现车端控制&xff0c;简化用户的操控&xff1b;某些高端车提供的通过手机App控制锁车、开关车窗和空调等的控制能力提升了用户体验&xff1b;...
    文章 2021-07-06 342浏览量
  • 微服务架构下,如何打造别具一格的服务治理体验?...

    此外,消息队列会持久化数据,防止由于接收端宕机导致的数据丢失。二、服务调用的自适应机制 服务调用过程中往往会遇到各种异常。单体架构的年代,由于基本都是内存调用,几乎很少遇到这类问题,只有在跨系统的时候...
    文章 2017-05-11 1769浏览量
  • 如何将一棵LSM-Tree塞进NVM

    数据一致性:PM到磁盘的合并涉及到数据库状态的改变,可能在系统宕机时出现数据一致性问题。针对该问题,本文通过在磁盘中维护描述日志(manifest log)的方式保证数据库状态改变的数据一致性。由于描述日志不在前端...
    文章 2021-09-10 224浏览量
  • 揭秘 Twitter 背后的基础设施:效率与优化篇

    有时候一台主机的异常(例如在部署过程中它临时宕机了)会导致整个站点都无法正常工作。在 2012/2013 年的时候,Twitter 开始尝试两个新事物:服务发现(来自 ZooKeeper 集群和 Finagle 核心模块中的一个库)和 ...
    文章 2017-06-06 1395浏览量
  • 带你读《跟老男孩学Linux运维:核心基础篇(上)(第2...

    在服务器主板上安装蓄电池,在断电后宕机前瞬间将内存数据回写到磁盘。UPS(一组蓄电池)不间断供电(IDC数据中心机房一般都会用UPS持续供电)。UPS(Uninterruptible Power System/Uninterruptible Power Supply)...
    文章 2019-11-11 1085浏览量
  • 如何将一棵LSM-Tree塞进NVM

    这主要是由于以下两个原因&xff1a;xff08;1&xff09;云上用户通常会购买较小内存的数据库实例&xff1b;xff08;2&xff09;LSM-tree需要维持小的内存表保证快速的刷盘操作。对于256MB的内存表&xff0c;我们发现将仅持久化叶子...
    文章 2021-09-23 118浏览量
  • 【干货】吴甘沙清华讲:大数据的10个技术前沿(上)

    你为了让他能够起到存储的作用,就必须要想办法,比如说通过冗余的方法在不同节点里面都存同一个数据,这样一台机器掉了,它的数据还能够存在。当你的数据都留在内存里面以后,不同节点之间数据的传输就变得非常...
    文章 2017-05-02 779浏览量
  • 如何设计稳定性横跨全球的 Cron 服务

    anacron 是一个例外,它是 crontab 的一个补充,它尝试运行哪些因为服务器宕机而应该执行却没执行的任务。这仅限于每日或者更小执行频率的任务,但对于在工作站和笔记本电脑上运行维护工作非常有用。通过维护一个...
    文章 2017-06-05 1091浏览量
  • 面试题有哪些

    ​使用int的原因是,对于当下32位的处理器(CPU)来说,一次处理数据是32位(这里不是指的是32/64位系统,而是指CPU硬件层面),具有高效存取的特点。标识符的命名规则?标识符的含义 是指在程序中,我们自己定义的...
    文章 2021-10-07 14浏览量
  • IM系统的MQ消息中间件选型:Kafka还是RabbitMQ?

    vhost 就像是物理中的虚拟一样,它们在各个实例间提供逻辑上的分离,为不同程序安全保密地允许数据,它既能将同一个 RabbitMQ 中的众多客户区分开,又可以避免队列和交换器等命名冲突。多协议支持: 消息是信息...
    文章 2018-06-12 2409浏览量
  • 系统架构-基础篇-(高性能基础建设说明与选型条件)

    上述已经描述到数据库访问会有大量的磁盘操作,这里我们说下oracle是如何缓解这些问题的,至于它一直在数据库领域处于行业界得老大哥形象出现。它首先由一个SGA的全局区域,内部的其他区域已经在前面的文章中说明...
    文章 2011-05-15 2115浏览量

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化