• 还在担心服务挂掉?Sentinel Go 让服务稳如磐石

    当这些“黑马”商品访问量激增时,大量的请求会击穿缓存,直接打到 DB 层,导致 DB 访问缓慢,挤占正常商品请求的资源池,最后可能会导致系统挂掉。这时候,利用 Sentinel 的热点参数流量控制能力,自动识别热点参数...
    文章 2020-09-22 2998浏览量
  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    由于后端分布式一致性服务单元由5台Master机器组成,可以容忍同时2台机器挂掉,因此上述报警均没有发现对服务可用性产生影响。但是,在短时间之内频繁发生单个Master服务进程异常,这个对于服务稳定性是个极大隐患,...
    文章 2019-12-20 159浏览量
  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    由于后端分布式一致性服务单元由5台Master机器组成,可以容忍同时2台机器挂掉,因此上述报警均没有发现对服务可用性产生影响。但是,在短时间之内频繁发生单个Master服务进程异常,这个对于服务稳定性是个极大隐患,...
    文章 2019-12-20 1745浏览量
  • MYSQL数据丢失讨论

    如果你有从数据库新建一直到数据库挂掉的所有redo,那么你可以将数据完完整整的重新build出来。但是这样的话,速度肯定很慢。所以一般每隔一段时间,数据库会做一个checkpoint的操作,做checkpoint的目的就是为了让...
    文章 2017-05-02 2212浏览量
  • Redis缓存穿透和缓存雪崩以及解决方案

    缓存雪崩缓存雪崩是指,由于缓存层承载着大量请求,有效的保护了存储层,但是如果缓存层由于某些原因整体不能提供服务,于是所有的请求都会达到存储层,存储层的调用量会暴增,造成存储层也会挂掉的情况。...
    文章 2019-04-08 1765浏览量
  • 基于 Seata Saga 设计更有弹性的金融应用

    在更上层的业务系统因为流程多流程长,开发 TCC 成本比较高,大都会权衡采用 Saga 模式来到达业务最终一致性,由于历史的原因不同的 BU 有自己的一套“补偿”事务的方案,基本上是两种: 一种是当一个服务在失败时...
    文章 2019-11-07 703浏览量
  • Seata 长事务解决方案 Saga 模式|SOFAChannel#10 回顾

    典型业务系统:如金融网路(与外部机构对接)、互联网微贷、渠道整合、分布式架构下服务集成等业务系统;银行业金融机构使用广泛;其优势: 一阶段提交本地事务,无锁,高性能;参与者可异步执行,高吞吐;补偿服务...
    文章 2020-01-19 799浏览量
  • 阿里 双11 同款流控降级组件 Sentinel Go 正式 GA,...

    当这些“黑马”商品访问量激增时,大量的请求会击穿缓存,直接打到 DB 层,导致 DB 访问缓慢,挤占正常商品请求的资源池,最后可能会导致系统挂掉。这时候,利用 Sentinel 的热点参数流量控制,自动识别热点参数并...
    文章 2020-12-07 4578浏览量
  • 阿里云HybridDB for PostgreSQL内存与负载管理...

    3、计算每个segment的内存使用上线保护参数:gp_vmem_protect_limit,除以挂掉一台节点后单台节点需要运行的primary数。gp_vmem_protect_limit calculation gp_vmem_protect_limit=gp_vmem/maximum_acting_primary_...
    文章 2017-08-26 2426浏览量
  • 【转】聊聊高并发系统之降级特技

    还有有时候通过任务系统调用一些服务,但是服务依赖的数据库可能存在:网卡被打满了、挂掉了或者很多慢查询,此时需要暂停下任务系统让服务方进行处理;还有发现突然调用量太大,可能需要改变处理方式(比如同步转换...
    文章 2017-07-03 1622浏览量
  • 微服务与配置中心:别让您的微服务被配置管理“绊”了...

    在面向分布式的微服务系统中,如何通过更高效的配置管理方式,帮助微服务系统架构持续“无痛”的演进,动态调整和控制系统的运行时飞行姿态,值得我们好好的在配置管理上重新思考和设计。正文 我的这个话题只能算是...
    文章 2018-02-12 7374浏览量
  • 不懂 ZooKeeper?没关系,这一篇给你讲的明明白白

    面试常常被要求「熟悉分布式技术」,当年搞“XXX管理系统”的时候,我都不知道分布系统是个啥。分布系统是一个硬件或软件组件分布在不同的网络计算机中上,彼此之间仅仅通过消息传递进行通信和协调的系统。...
    文章 2020-09-15 1729浏览量
  • 阿里妈妈基于TensorFlow做了哪些深度优化?...

    新的Failover机制可以保证任意角色挂掉的情况下,系统都能在分钟级完成Failover,并且不多算和漏算数据TensorFlowRS的整体架构如图所示: 三.PS-Plus PS-Plus相对于传统的ParameterServer有如下特点: (1)高性能:...
    文章 2018-04-26 5948浏览量
  • concepts阅读总结4——事务

    ITL个数其最小值为1,由参数initrans控制(由于兼容性的原因,oracle会在对象的存储块分配两个itl,所以initrans的最小值实际上为2),最大值为255,由参数maxtrans控制,最大值参数在10g以后不能被修改,itl是block...
    文章 2011-12-18 1155浏览量
  • 分布系统架构,回顾2020年常见面试知识点梳理(每次...

    一个可靠安全的系统,肯定要考虑数据的可靠性,尤其对于内存为主的 Redis,就要考虑一旦服务器挂掉,启动之后,如何恢复数据的问题,也就是说数据如何持久化的问题。AOF 就是备份操作记录。AOF 由于是备份操作命令,...
    文章 2020-12-30 236浏览量
  • 消息队列在测试开发中的应用思路

    消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别...
    文章 2017-03-17 1048浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    做到每个环节使用相互独立的多台服务器进行分布式处理,要针对不同稳定性要求级别和成本能力做到不同服务器规模分布式,这样就避免单个服务器挂掉引发单点故障后进而导致服务整体挂掉的风险。可能涉及的环节有端动态...
    文章 2021-01-27 8431浏览量
  • 超全总结|阿里如何应对电商故障?...

    系统改造验收:对于分布系统,至少应该做到运行态中不会因为我依赖的系统出现故障,而引起当前应用出现可用性的问题,比如进程挂掉,频繁FullGC,负载飙高等,何时何地都具备快速止血的能力。限流降级参考:对于弱...
    文章 2017-06-19 3775浏览量
  • 系统架构-基础篇-(高性能基础建设说明与选型条件)

    主意解决如果它挂掉会产生什么问题,它的基础原理是一种Key-Value方式,但是通用的东西往往不是性能最佳的东西,所以你在有必要的情况下可以适当做下修改,淘宝网的tair开源技术就是一套自己完成的分布式缓存技术,...
    文章 2011-05-15 2126浏览量
  • 聊聊互联网营销的第4门功课(详细)

    对于稳定性有强要求的业务方,为了防止空数据,前台场景还可设置多重兜底,如果前台数据源因为各种原因挂掉,可兜底切换为从第三方数据源(如配置中心)拿提前准备好的兜底数据,保障消费者体验。服务基础层分布式...
    文章 2021-08-19 268浏览量
  • 消息队列入门(一)关于消息队列

    消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别...
    文章 2017-11-22 699浏览量
  • The Log(分布式Log学习)

    你会发现,版本控制分布系统中,复制都是基于log的:当你更新版本时,你只是拉取了反映了版本变化的补丁,并应用于当前的分支快照。2.3 数据集成(Data integration)2.3.1 数据集成的含义 所谓数据集成,就是将...
    文章 2017-11-14 1159浏览量
  • 消息队列入门(一)关于消息队列

    消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别...
    文章 2016-05-05 2451浏览量
  • DockOne微信分享(一四四):BizCloud:基于...

    Nginx会实时从服务管理中心获取服务对应关系,动态加载Nginx配置,将已经挂掉的Pod1从Nginx中摘除,新增加的PodN暴露给外部。而SOA服务的角色分为两种,一种是consumer,一种是provider。consumer和provider之间的...
    文章 2017-10-10 2309浏览量
  • 使用消息队列的 10 个理由

    消息队列降低了进程间的耦合度,所以即使一个处理消息的进程挂掉,加入队列中的消息仍然可以在系统恢复后被处理。而这种允许重试或者延后处理请求的能力通常是造就一个略感不便的用户和一个沮丧透顶的用户之间的区别...
    文章 2013-08-21 628浏览量
  • 带你读《极简Spring Cloud实战》之一:微服务与Spring...

    为了降低用户构建和维护分布系统的难度,推动微服务的落地,Spring Cloud提供了快速构建分布式微服务系统的一些常用功能,如配置管理、服务发现、断路器、智能路由、服务代理、控制总线等提供的一套开发工具。...
    文章 2019-11-17 1715浏览量
  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障...

    第二步,如何保证后端数据库挂掉的数据时候能迁过去?下图可以看到,Nginx中使用lua脚本进行实现,它会检测后端服务返回的一些状态,使用计数器计算失败次数,如果频繁的达到一定程度的失败次数,就切换到从Vanish...
    文章 2019-04-25 2463浏览量
  • Hbase问题汇总与解答

    一个常问的问题就是Master挂掉的时候,Hbase会发生什么事情,因为Hbase客户端是直接和RegionServer进行通信,而且hbase:meta表并没有存在Master节点上,Master只是进行RegionServer的故障恢复和Region的切分,因此在...
    文章 2019-01-31 193738浏览量
  • 数据库与存储系统

    根据与许多客户的沟通,客户往往最容易忽略掉的环节就是存储系统,而存储系统里面,文件系统被关注是最少的。本次技术分享的关注点就是存放数据库的文件系统,将简单描述文件系统及其缓存大概的架构,基本的工作原理...
    文章 2017-05-02 1746浏览量
  • Elasticsearch架构

    实现了translog,提供了实时的数据读取能力以及完备的数据持久化能力(在服务器异常挂掉的情况下依然不会丢数据)。Lucene 因为有 IndexWriter buffer,如果进程异常挂掉,buffer中的数据是会丢失的。所以 ...
    文章 2016-12-09 1741浏览量
1 2 3 4 ... 8 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化