• 容器化应用的服务可用性

    对于电话软件,99.999%的服务可用性是必需具备的(例如每年只能有小于5.26分钟的故障宕机时间)。我在摩托罗拉和贝尔实验室的后续几年,学习了如何建立和运维高可用性系统。在那个时代里(约为90年代中期),高可用...
    文章 2017-10-10 1135浏览量
  • 关于分布式计算的一些概念

    系统几乎不会宕机(高可用性 99.9999999%一年只有 31 ms 宕机)。Akka虽然是Scala写成的,但是由于Scala最终还是编译为Java字节码运行在JVM上,所以我们可以认为Akka属于Java领域。Akka处理并发的方法基于Actor模型。...
    文章 2018-06-03 4108浏览量
  • 图形数据库和NOSQL

    高可用性(A):所有客户端总能找到所请求数据的至少一个版本,即使集群中某些机器已经宕机, 分区容忍性(P):整个系统保持自己的特征,即使是被部署到不同服务器上的时候,这对客户端来讲是透明的。CAP法则假定向...
    文章 2017-05-17 1629浏览量
  • 微服务架构详谈

    贫血模型完全依靠数据库对并发的支撑,实现可以简化很多,但充血模型就得自己实现了,不管是在内存中通过锁对象,还是使用Redis的远程锁机制,都比贫血模型复杂而且可靠性下降,这是充血模型带来的挑战。更好的办法...
    文章 2018-09-26 1220浏览量
  • Redis夺命连环11问

    速度快的原因主要有几点:完全基于内存操作C语言实现,优化过的数据结构,基于几种基础的数据结构,redis做了大量的优化,性能极高使用单线程,无上下文的切换成本基于非阻塞的IO多路复用机制那为什么Redis6.0之后又...
    文章 2021-03-05 799浏览量
  • Uber是如何使用MySQL设计可扩展性数据存储的?

    如果凌晨3点我们接到叫车请求,但是这时数据存储无法响应查询,导致业务宕机,我们是否有相关操作知识可以快速解决这个问题。鉴于以上种种,我们分析了几种常用的选择的优势和潜在的限制,比如Cassandra、Riak、...
    文章 2017-05-02 1861浏览量
  • 带你读《HBase原理与实践》之一:HBase概述

    因为稳定性的原因,并不建议在生产线上使用1.0.0~1.1.2中间的版本。目前,HBase社区推荐使用的稳定版本为1.4.10。2.x版本是接下来最受期待的一个版本(升级要慎重,请参考社区中的实践),因为最近一两年社区开发的...
    文章 2019-11-01 3416浏览量
  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-02 2245浏览量
  • 华为架构师8年经验谈:从单体架构到微服务的服务化...

    可靠性差:某个应用BUG,例如死循环、OOM等,会导致整个进程宕机,影响其它合设的应用 如何解决传统单体架构面临的挑战?解决对策:1、拆分 2、解耦 3、透明 4、独立 5、分层。拆分:对应用进行水平和垂直拆分,...
    文章 2017-05-02 2596浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    接下来,进行数据处理,特征数据进入到实时预测模型中,进行非预测宕机模型、可预测宕机模型、混合模型、高准确率、高召回模型;下一步进入投票模型,投票到各种各样的优先级的sls预测数据中,当precision大于50%时...
    文章 2020-10-28 2745浏览量
  • 阿里云基础产品技术月刊 2019年2月

    通过Blink实时流计算平台,已经在Blink平台上完成了内存故障预测模型的搭建,并打通数据反馈路径并将预测宕机的相关结果回流到阿里云日志服务(SLS)的日志中。后续计划和ECS的调度系统打通,增加系统中宕机风险的...
    文章 2019-03-13 2986浏览量
  • 《架构真经:互联网技术架构的设计》大道至简

    1999年6月宕机事件后的几个月里,eBay的网站又接二连三地出现了几次不同规模的宕机,尽管引起每次宕机的原因有所不同,但是,问题的根源都指向该网站无法应付空前急剧增长的大量用户请求。这些宕机事件彻底改变了该...
    文章 2017-05-19 3392浏览量
  • 云时代如何实现企业IT智能诊断?...

    而此时可能服务器已经宕机,只能被迫宕机才能解决问题、恢复业务。随着云时代的到来,智能诊断则是针对传统监控的一场革命,表现在: 诊断范围对象扩大:不仅可以诊断传统IT环境,同时可以诊断多种云环境;不仅...
    文章 2019-04-12 1528浏览量
  • 阿里云专访Redisson作者Rui Gu:构建开源企业级Redis...

    这样的设计虽然可以很大程度上避免客户端程序宕机或业务节点挂掉造成的影响,但是随之带来的弊端是遇到服务端Redis进程宕机或节点挂掉的情况,还是有可能会造成锁的信息丢失,这样的缺陷显然无法满足某些特定场景...
    文章 2018-06-25 10279浏览量
  • 云原生应用和容器设计模式的综述和展望

    如本系列文章前文所述,PetSet里的Pod有一个固定的编号和身份,对应固定的存储,一旦某个编号的Pod宕机,同样编号的Pod要被启动起来并挂在到同样的存储设备上,接替以前编号的Pod工作。以较真的角度说,“PetSet”这...
    文章 2016-12-13 2455浏览量
  • HBase 系统架构

    在分布式系统环境中,无法避免系统出错或者宕机,一旦HRegionServer以外退出,MemStore中的内存数据就会丢失,引入HLog就是防止这种情况。工作机制: 每个HRegionServer中都会有一个HLog对象,HLog是一个实现Write ...
    文章 2017-05-02 917浏览量
  • 28个MongoDB 的问题

    从备份数据库声明主数据库宕机到选出一个备份数据库作为新的主数据库将花费10到30秒时间。这期间在主数据库上的操作将会失败-包括写入和强一致性读取(strong consistent read)操作。然而,你还能在第二数据库上执行...
    文章 2015-01-06 1557浏览量
  • 纯干货|一篇讲透如何理解数据库并发控制

    事务只要提交了,它的结果就不能改变了,即使遇到系统宕机,重启后数据库的状态与宕机前一致,这就是事务的持久性。数据只要存储非易失存储介质,宕机就不会导致数据丢失。因此数据库可以采用以下方法来保证持久性:...
    文章 2020-04-24 702浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2781浏览量
  • 一篇讲透如何理解数据库并发控制(纯干货)

    事务只要提交了,它的结果就不能改变了,即使遇到系统宕机,重启后数据库的状态与宕机前一致,这就是事务的持久性。数据只要存储非易失存储介质,宕机就不会导致数据丢失。因此数据库可以采用以下方法来保证持久性:...
    文章 2020-04-09 1036浏览量
  • 反应式编程探索与总结

    需要异步的原因,是为了并行的使用资源,在多个主机或同一主机多个CPU核的场景下。The main goal of Reactive Streams is to govern the exchange of stream data across an asynchronous boundary – think passing...
    文章 2019-11-25 967浏览量
  • 面试题有哪些

    ​使用int的原因是,对于当下32位的处理器(CPU)来说,一次处理数据是32位(这里不是指的是32/64位系统,而是指CPU硬件层面),具有高效存取的特点。标识符的命名规则?标识符的含义 是指在程序中,我们自己定义的...
    文章 2021-10-07 14浏览量
  • redis之 Redis常用数据类型

    谁说NoSQL都不支持事务,虽然Redis的Transactions提供的并不是严格的ACID的事务(比如一串用EXEC提交执行的命令,在执行中服务器宕机,那么会有一部分命令执行了,剩下的没执行),但是这个Transactions还是提供了...
    文章 2017-11-12 962浏览量
  • 当 K8s 集群达到万级规模,阿里巴巴如何解决系统各...

    2s),即使在异常宕机时,备仅需等待 leader lease 的过期(默认 15s),无需要花费几分钟重新同步数据。通过这个增强,显著的降低了 controller MTTR,同时降低了 controller 恢复时对 API Server 的性能冲击。该...
    文章 2019-09-23 3611浏览量
  • 带你读《并发模式与应用实践》之一:并发简介

    在任何一个节点出现故障(硬件故障)的情况下,其他冗余节点都将取而代之,从而确保整个系统永远不会宕机。1.1.2 分时 在现实生活中,我们也同时执行着许多任务。我们专心处理一项任务时,如果另一项任务也需要处理...
    文章 2019-11-04 1282浏览量
  • Varnish介绍安装及应用

    VCL的return语句用于将控制权从VCL状态引擎返回给Varnish,而非默认函数,这就是为什么VCL只有终止语句而没有返回值的原因。同时,对于每个“域”来说,可以定义一个或多个终止语句,以告诉Varnish下一步采取何种...
    文章 2017-11-09 905浏览量
  • 读《大型网站技术架构》

    2)服务器越多,宕机的概率越大 常用的分布式方案: 1)分布式应用和服务;2)分布式静态资源;3)分布式数据和存储;4)分布式计算;5)分布式配置、分布式锁、分布式文件系统。集群,即多台服务器部署相同的应用,...
    文章 2017-04-09 972浏览量
  • 为什么Flink会成为下一代大数据处理框架的标准?

    因此Flink较其他分布式处理的框架则会显得更加稳定,不会因为JVM GC等问题而导致整个应用宕机的问题。Save Points(保存点) 对于7*24小时运行的流式应用,数据源源不断的接入,在一段时间内应用的终止都有可能导致...
    文章 2019-09-21 1169浏览量
  • 阿里云基础产品技术月刊 2019年3月

    客户B在评测Ali-Perseus+MXNet,目前反馈,与客户的自有MXNet框架整合顺利,检测模型的432卡性能提升10%以上,性能上限接近线形加速比,客户仍在进一步测试中。客户可以完全保留之前的开源训练框架不变的同时,...
    文章 2019-04-11 4405浏览量
  • 为什么 K8s 集群达万级规模,阿里购物体验还能如丝...

    List-Watch 是 Kubernetes 中 Server 与 Client 通信最核心一个机制,etcd 中所有对象及其更新的信息,API Server 内部通过 Reflector 去 watch etcd 的数据变化并存储到内存中,controller/kubelets 中的客户端也...
    文章 2019-10-16 4696浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化