• 架构设计|分布式体系下,服务分层监控策略

    底层硬件资源爆发的故障,来自上层的应用服务或者中间件服务触发的可能性偏高。硬件层面的监控有许多成熟的框架,例如zabbix,grafana等,当然这些组件功能很丰富,不仅仅在硬件层应用。5、雪崩效应 有些故障导致大...
    文章 2020-09-17 600浏览量
  • 数十万应用结点全息监控,ARMS新上线的应用监控神器...

    真正符合市场需求的应用监控除了排查单一应用故障,还能站在全局角度准确定位应用之间的问题,并且将问题直观的抽取出来。帮助企业迅速获得问题的源头,真正提高应用服务效率。据ARMS相关产品负责人介绍。ARMS 应用...
    文章 2017-12-21 6575浏览量
  • 10 人,2 个月|虾米音乐的监控体系升级之路

    前面两种类型的监控已经基本可以定位到故障是否由于程序 Bug、上游应用或单机故障引起的,还有一类就是对中间件的监控,这里我们利用了 Sunfire 的基础监控对应用的 CPU、Load、JVM、HSF(Dubbo)、MetaQ 等中间件的...
    文章 2019-08-22 2260浏览量
  • “前端+应用”两大监控利器商业化首发 ARMS领跑APM...

    和同类APM类工具相比,基于鹰眼的ARMS应用监控功能除了能够比较好的提供分布式应用的调用链、本地调用堆栈、异常捕获、各类中间件接口调用监控功能以外,还具备以下优点: 支持接口广泛:首次推出的应用监控除支持...
    文章 2018-03-12 5676浏览量
  • 消息中间件Kafka与RabbitMQ谁更胜一筹?

    这个功能有个很常见应用场景就是 CDC(Change Data Chapture)。以 MySQL 为例,如果其传输的 Binlog 的顺序出错,比如原本是先对一条数据加 1,然后再乘以 2,发送错序之后就变成了先乘以 2 后加 1,造成数据不一致...
    文章 2019-01-14 2843浏览量
  • ——中间件专家带你“重走”双11高可用架构演进之路

    前期,我们将阿里电商常见故障进行画像和分析,得到初步结论,按照IaaS、PaaS、SaaS层进行初步划分,但这个模型无法完全通用,并非包含所有的故障;因此,后期我们对这一模型又进一步抽象,将故障分为进程内的故障...
    文章 2017-08-04 7744浏览量
  • 消息中间件选型分析——从Kafka与RabbitMQ的对比来看...

    这个功能有个很常见应用场景就是CDC(Change Data Chapture),以MySQL为例,如果其传输的binlog的顺序出错,比如原本是先对一条数据加1,然后再乘以2,发送错序之后就变成了先乘以2后加1了,造成了数据不一致。...
    文章 2018-04-14 2230浏览量
  • 消息中间件选型分析

    这个功能有个很常见应用场景就是CDC(Change Data Chapture),以MySQL为例,如果其传输的binlog的顺序出错,比如原本是先对一条数据加1,然后再乘以2,发送错序之后就变成了先乘以2后加1了,造成了数据不一致。...
    文章 2018-04-07 1442浏览量
  • 分布式系统架构技术分析(一)

    同时,通过这层中间件,也能实现所有数据库参数的动态调整、路由规则动态调整、数据库分片权重的调整,从而在应用层实现数据库访问的高可用,且不依赖于数据库高可用机制,甚至提供更灵活强大的故障容忍能力。...
    文章 2019-08-03 1186浏览量
  • Kafka or RabbitMQ:消息中间件选型深入分析

    这个功能有个很常见应用场景就是CDC(Change Data Chapture),以MySQL为例,如果其传输的binlog的顺序出错,比如原本是先对一条数据加1,然后再乘以2,发送错序之后就变成了先乘以2后加1了,造成了数据不一致。...
    文章 2019-04-12 2038浏览量
  • 消息中间件选型分析——从Kafka与RabbitMQ的对比来看...

    这个功能有个很常见应用场景就是CDC(Change Data Chapture),以MySQL为例,如果其传输的binlog的顺序出错,比如原本是先对一条数据加1,然后再乘以2,发送错序之后就变成了先乘以2后加1了,造成了数据不一致。...
    文章 2018-05-06 8288浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    阿里巴巴集团内的核心业务的常见故障(非业务自身逻辑问题)都可以通过流量、时延、错误等 3 类指标反应出来,我们称之为黄金指标:流量:业务流量跌零 OR 不正常大幅度上涨下跌,中间件流量如消息提供的服务跌零等...
    文章 2021-07-06 214浏览量
  • IM系统的MQ消息中间件选型:Kafka还是RabbitMQ?

    这个功能有个很常见应用场景就是 CDC(Change Data Chapture),以 MySQL 为例,如果其传输的 binlog 的顺序出错,比如原本是先对一条数据加 1,然后再乘以 2,发送错序之后就变成了先乘以 2 后加 1 了,造成了...
    文章 2018-06-12 2408浏览量
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    分布式系统常见依赖故障治理及技术演进 首先抛一个问题,什么情况下你会认为淘宝网挂了?我相信关注这个问题的人很多,不过能给出确切答案的人并不多。因为这个看似简单的问题,真要回答起来好像也不是那么容易。...
    文章 2017-06-19 3656浏览量
  • 应用及业务高可用提升工具平台之故障演练

    丰富的故障场景丰富的故障场景也是AHAS Chaos的一大特色,包括以下场景:常见的基础设施资源例如CPU、内存、磁盘等。应用级别的故障注入,目前支持Java应用,后续将陆续推出对于NodeJs和C++的应用故障注入。云原生...
    文章 2020-07-06 2397浏览量
  • 《大型网站系统与Java中间件》读书笔记(上)

    某个应用只有一台机器上运行着,如果这台机器上出现了问题,导致这个应用无法运行,这就叫单点故障。最后 这本书《大型网站系统与Java中间件》的前三章主要是铺垫什么是中间件、什么是分布式(从单机演进到分布式的...
    文章 2019-06-10 4898浏览量
  • 【分布式系统工程实现】GFS&Bigtable设计的优势

    如果单个子表较小,比如常见的256MB一个子表,单机服务的数据有限。Microsoft Azure的设计可参考论文。Yahoo PNUTS采用消息中间件Yahoo Message Broker来进行操作日志的可靠存储。虽然多个子表将操作日志写入到不同...
    文章 2016-04-11 1669浏览量
  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生...

    团队对集团内的历年故障做了一次仔细梳理,集团内的核心应用通常有四类故障(非业务自身逻辑问题):资源类、流量类、时延类、错误类。再往下细分: 资源类:比如 cpu、load、mem、线程数、连接池;流量类:业务流量跌...
    文章 2019-12-20 871浏览量
  • Kubernetes必备知识:Kubernetes API编程利器 ...

     Operator应用场景在传统运维环境中,中间件都是基于非容器部署,我们往往会面对各种部署及运维需求: 备份&数据恢复。备份分为冷备和热备。冷备通常可以通过定时任务执行,对于即时的备份需求,大公司内部...
    文章 2020-02-20 579浏览量
  • 分布式系统工程实现:GFS&Bigtable设计的优势,...

    如果单个子表较小,比如常见的256MB一个子表,单机服务的数据有限。Microsoft Azure的设计可参考论文。Yahoo PNUTS采用消息中间件Yahoo Message Broker来进行操作日志的可靠存储。虽然多个子表将操作日志写入到不同...
    文章 1970-01-01 872浏览量
  • 阿里云发布新一代云原生产品,加速企业向现代 IT 架构...

    除了应用托管平台以及常见中间件之外,阿里云还提供了非常丰富的应用工具,常见的如应用的监控工具、压测工具、开发工具、镜像仓库等,都可以帮助用户提高生产效率。随着越来越多的用户使用容器进行高密度部署,...
    文章 2020-06-12 555浏览量
  • 阿里巴巴在混沌工程领域的实践和思考

    2016年,故障演练项目立项(GOC+中间件),重新设计架构和产品流程,确定产品名为MonkeyKing,在交易和中间件链路尝试演练。2016年11月,开始筹备和推进线上微灰度环境的建设。2017年3月,具备前后端灰度隔离的能力...
    文章 2018-12-19 3237浏览量
  • PostgreSQL 10.1 手册_部分 III....

    PostgreSQL不提供这种复制类型,尽管在应用代码或中间件中可以使用PostgreSQL的两阶段提交(PREPARE TRANSACTION和COMMIT PREPARED)来实现这种复制。商业方案 因为PostgreSQL是开源的并且很容易被扩展,一些公司...
    文章 2018-10-03 1312浏览量
  • 万亿级数据洪峰下的分布式消息引擎

    通过简单回顾阿里中间件(Aliware)消息引擎的发展史,本文开篇于双11消息引擎面临的低延迟挑战,通过经典的应用场景阐述可能会面临的问题-响应慢,雪崩,用户体验差,继而交易下跌。为了应对这些不可控的洪峰数据,...
    文章 2017-02-07 7031浏览量
  • SOA之基于服务总线的设计

    业界主流的消息总线(消息中间件)产品,普遍支持消息过滤、自动重试、分布式事务、持久化、消息优先级、消息回溯、(生产者/消费者/中间件自身)集群、故障转移等高级特性。总结 基于总线架构的主要优势在于: l ...
    文章 2015-03-21 1043浏览量
  • 编程体系结构(09):分布式系统架构

    一、基础概念 1、单服务 所有业务服务和应用组件部署在一台服务上,节省成本,这是单服务结构...底层硬件资源爆发的故障,来自上层的应用服务或者中间件服务触发的可能性偏高。成熟的监控框架,例如zabbix,grafana等。
    文章 2020-10-16 1384浏览量
  • 安全看得见,阿里云性能监控 ARMS 全真3D拓扑实现一...

    ARMS 3D拓扑功能提供了一种全新的交互方式,扩充了和应用沟通的维度,实现了360度全方位诊断性能瓶颈和故障节点,以甄别故障出现时,哪些应用和哪些关联的主机出现了问题等,从此,应用离我们如此之近。欢迎加入...
    文章 2018-11-13 3154浏览量
  • 【双11背后的技术】万亿级数据洪峰下的分布式消息引擎

    通过简单回顾阿里中间件(Aliware)消息引擎的发展史,本文开篇于双11消息引擎面临的低延迟挑战,通过经典的应用场景阐述可能会面临的问题-响应慢,雪崩,用户体验差,继而交易下跌。为了应对这些不可控的洪峰数据,...
    文章 2017-01-12 5706浏览量
  • 阿里云DRDS-MySQL中间件总结分享

    它使用灵活,没有限制,常见的用途包括:负载均衡,故障、查询分析,查询过滤和修改等等。MySQL Proxy就是这么一个中间层代理,简单的说,MySQL Proxy就是一个连接池,负责将前台应用的连接请求转发给后台的数据库,...
    文章 2019-12-13 804浏览量
  • 水平分库分表的关键步骤和技术难点

    增加了额外的硬件投入和运维成本,同时,中间件自身也存在性能瓶颈和单点故障问题,需要能够保证中间件自身的高可用、可扩展。总之,不管是使用分布式数据访问层还是数据库中间件,都会带来一定的成本和复杂度,也会...
    文章 2016-11-17 1583浏览量
1 2 3 4 ... 12 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化