• 关于

    业务量发生器挂掉的原因

    的搜索结果
  • 预防宕机靠RAC,和力记易说那就OUT了

       “宕机”是计算机术语,是根据英文down翻译过来的,是指系统无法从一个系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重启动系统的现象。日常生活中我们遇到的电脑“蓝屏”就是宕机的一种常见表现,此外,专业IT机房里的服务器也会因为数据库死锁、某些服务挂掉等发生宕机。 ...

    文章 boxti 2017-08-09 786浏览量

  • 稳定性思考-强弱依赖

    淘宝系统依赖关系比较复杂。A系统依赖B系统资源,当B系统发生故障的时候,A系统势必会被拖累,导致A系统也发生故障                                  图:[ A]--依赖-->[B] 这里的依赖要区分两种情况 1、A强依赖于B     任何强依赖都要尽可能的转化...

    文章 中间件小哥 2016-04-08 2832浏览量

  • 惊魂48小时,阿里工程师如何紧急定位线上内存泄露?

    作者 | 朱云锋 1、问题初现 该风险隐患在2019年10月下旬某天开始浮现,不到24小时的时间里,值班同学陆续收到多个线上电话报警,显示某业务集群中分布式协调服务进程异常: 14:04:28,报警显示一台Follower意外退出当前Quorum,通过选举重新加入Quorum;16:06:35,报...

    文章 檸,铮 2019-12-20 96浏览量

  • 当云HBase2.0被赋能了search

    概述 云HBase2.0也就是我们即将要上线的ApsaraDB for HBase2.0。它不仅兼容开源HBase2.0,也承载着阿里多年大规模HBase使用的技术积淀,还有广大公有云用户喜欢的商业化功能。在大数据量场景中已经具有如此优势的云HBase2.0,如果还能search呢? 技术简介 云...

    文章 瑾谦 2018-06-06 5675浏览量

  • 高可用系统常用解决手段浅述

    所谓可用性,是指 某系统能够提供正常服务的特性。 可用性的高低是使用不可用时间占总时间的比例来衡量。不可用时间是从故障发生到故障恢复的时间。 比如,可用性 4 个 9 的系统(99.99%),它一年宕机时间不能超过53分钟(=365*24*60*(1-0.9999)) 。 做到高可用系统,需要尽可...

    文章 知与谁同 2017-05-23 1334浏览量

  • 降本增效利器!趣头条Spark Remote Shuffle Service最佳实践

    王振华,趣头条大数据总监,趣头条大数据负责人 曹佳清,趣头条大数据离线团队高级研发工程师,曾就职于饿了么大数据INF团队负责存储层和计算层组件研发,目前负责趣头条大数据计算层组件Spark的建设 范振,花名辰繁,阿里云计算平台EMR高级技术专家,目前主要关注开源大数据技术以及云原生技术。 1. ...

    文章 黯灭_邓彬 2020-12-07 4810浏览量

  • Seata 长事务解决方案 Saga 模式 | SOFAChannel#10 回顾

    ,有趣实用的分布式架构频道。本文根据 SOFAChannel#10 直播分享整理,主题:分布式事务 Seata 长事务解决方案 Saga 模式详解。回顾视频以及 PPT 查看地址见文末。欢迎加入直播互动钉钉群:23372465,不错过每场直播。 大家好,我是陈龙,花名: 屹远(_long187@...

    文章 花肉酱 2020-01-19 585浏览量

  • 基于 Seata Saga 设计更有弹性的金融应用

    Seata 意为:Simple Extensible Autonomous Transaction Architecture,是一套一站式分布式事务解决方案,提供了 AT、TCC、Saga 和 XA 事务模式,本文详解其中的 Saga 模式。项目地址:https://github.com/seat...

    文章 花肉酱 2019-11-07 587浏览量

  • 大众点评账号业务高可用进阶之路

    引言 在任何一家互联网公司,不管其主营业务是什么,都会有一套自己的账号体系。账号既是公司所有业务发展留下的最宝贵资产,它可以用来衡量业务指标,例如日活、月活、留存等,同时也给不同业务线提供了大量潜在用户,业务可以基于账号来做用户画像,制定各自的发展路径。因此,账号服务的重要性不言而喻,同时美团业务...

    文章 技术小能手 2018-06-14 1391浏览量

  • 负载均衡进阶:SLB常见问题解决方法

    摘要:在由云栖社区和阿里云网络团队联合主办的2017阿里云网络技术在线高峰论坛上,阿里云技术专家添毅分享了网络产品部根据客户和阿里云运维的反馈提炼出的几大最主要和最常见的在使用SLB产品中发生的问题,并为大家介绍了针对这些常见问题的相应处理方法。想知道如何借助SLB构建高可用系统以及健康检查是如何...

    文章 场景研读 2017-10-09 10160浏览量

  • 如何用消息系统避免分布式事务?

    前阵子从支付宝转账1万块钱到余额宝,这是日常生活的一件普通小事,但作为互联网研发人员的职业病,我就思考支付宝扣除1万之后,如果系统挂掉怎么办,这时余额宝账户并没有增加1万,数据就会出现不一致状况了。 上述场景在各个类型的系统中都能找到相似影子,比如在电商系统中,当有用户下单后,除了在订单表插入一条...

    文章 亮伟 2016-07-13 5243浏览量

  • 章文嵩(正明)博士和他背后的负载均衡(LOAD BANLANCER)帝国

    案首语: 阿里集团技术大牛,@正明,淘宝基础核心软件研发负责人、LVS创始人、阿里云首席科学家章文嵩博士从阿里离职,去追求技术人生另一段历程,让阿里像我一样的很多热爱技术的工程师都有一丝牵动和感触。 我个人作为一个平凡的一线技术工程师,对章博士是很敬佩的(虽然他还不认识我),国内IT业界这么多年...

    文章 坤宇 2016-05-26 16154浏览量

  • 章文嵩博士和他背后的负载均衡帝国

      本文作者:阿里中间件-坤宇 案首语: 阿里集团技术大牛,@正明,淘宝基础核心软件研发负责人、LVS创始人、阿里云首席科学家章文嵩博士从阿里离职,去追求技术人生另一段历程,让阿里像我一样的很多热爱技术的工程师都有一丝牵动和感触。 我个人作为一个平凡的一线技术工程师,对章博士是很敬佩的(虽然他...

    文章 kevinliali 2016-05-30 9349浏览量

  • 2017QCon分享:从淘宝到云端的高可用架构演进

    大家好,我今天分享的题目是《高可用实践:从淘宝到上云的差异》,取这个标题是因为会涉及到两个方面内容,一方面以淘宝为例子,传统的IDC的时候,我们稳定性是怎么做的,另外在云计算背景下,有很多创业公司是基于阿里云这样的公有云基础设施做研发,在公有云的环境下怎么做好我们系统的高可用。 长期做稳定性的人...

    文章 王晨纯 2017-10-25 2907浏览量

  • 如何用消息系统避免分布式事务?

     前阵子从支付宝转账1万块钱到余额宝,这是日常生活的一件普通小事,但作为互联网研发人员的职业病,我就思考支付宝扣除1万之后,如果系统挂掉怎么办,这时余额宝账户并没有增加1万,数据就会出现不一致状况了。   上述场景在各个类型的系统中都能找到相似影子,比如在电商系统中,当有用户下单后,除了在订单表插...

    文章 力君 2015-12-04 23071浏览量

  • 阿里搜索事业部故障快速恢复实践

    这篇文章中,我们将讨论面对故障时,我们为什么选择快速切流这种机制。如果选择快速切流,我们需要具备哪些条件,需要切流平台解决什么样的问题。最后,我们畅想故障快速恢复未来如何做的更好。 一、关于故障的几种解决思路 如何定义故障 我们一般从以下几个维度来定义故障。一是影响的用户数量,例如用户投...

    文章 卢占一十力 2018-03-16 2364浏览量

  • 纯干货 | 从淘宝到云端的高可用架构演进

    近日在Qcon开发者大会北京站上,来自阿里巴巴商家事业部技术专家沐剑在专场分享了题为《高可用实践:从淘宝到上云的差异》的演讲,主要介绍了其近几年在阿里电商平台及阿里云上的高可用设计的经验,分为两个部分:第一部分主要包括传统的淘宝店铺稳定性体系的建设及相关的基础链路设计、缓存和容灾方案的设计及部署;...

    文章 技术小能手 2017-06-19 2022浏览量

  • 阿里李运华:异地多活有哪些Impossible Mission?

    《碟中谍》系列电影中,汤姆克鲁斯主演的亨特特工,无论什么情况,什么环境下都能够有惊无险的完成那些看似不可能的任务。 对于技术人员来说,如果也能像汤姆克鲁斯那样,不管什么mission impossible最后都能解决,那迎娶白富美,当上CTO,走向人生巅峰都不是问题! “异地多活”看起来就是...

    文章 华仔爱技术 2016-11-29 6050浏览量

  • 阿里云栖开发者沙龙PHP技术专场-聊聊服务稳定性保障这些事

    摘要:本文主要带大家了解服务稳定性的重要性和相关策略。策略大概分两部分,第一方面从架构层面介绍保障服务稳定性的常见策略(限流,降级,隔离,超时,重试和集群)。第二个方面是从流程方面(code review, 压测,灰度和监控)讲解怎么去保证稳定性。 演讲嘉宾简介:信海龙(花名沧龙),十余年的互联网...

    文章 PHP小能手 2019-04-25 2238浏览量

  • 从IDC到云端架构迁移之路(GITC2016)

    机房迁移是一个很大的动作: 15年在58同城实施过一次(“逐日”项目),几千台物理机,从IDC迁到了腾讯的天津机房,项目做了10个多月,跨所有的部门,与所有的业务都相关; 16年在58到家又实施了一次(“凌云”项目),几百台虚拟机,从IDC迁到阿里云,前后大概一个季度的时间,也是所有技术部门都需要...

    文章 初商 2019-08-11 467浏览量

  • Redis复制与可扩展集群搭建

    Redis复制流程概述 Redis的复制功能是完全建立在之前我们讨论过的基于内存快照的持久化策略基础上的,也就是说无论你的持久化策略选择的是什么,只要用到了Redis的复制功能,就一定会有内存快照发生,那么首先要注意你的系统内存容量规划,原因可以参考我上一篇文章中提到的Redis磁盘IO问题。 R...

    文章 cnbird 2013-03-13 770浏览量

  • gig:自带负载均衡和降级功能的高可用RPC解决方案

    在线查询系统中,业务逻辑将服务划分为树状结构,每个节点通过水平扩展增加自身服务能力,最终形成下图所示拓扑结构:当一次查询从某一入口进入系统后,自上而下查询各个服务,每个服务又有多个节点可供选择,最简单的负载均衡策略是轮询或者一致性hash,各个节点接相同流量,但是这种策略下如果集群中出现了坏节点,...

    文章 7buds 2018-01-30 4872浏览量

  • 2020版中间件面试题总结(RabbitMQ+Kafka+ZooKeeper)

    RabbitMQ 1. RabbitMQ的使用场景有哪些? 抢购活动,削峰填谷,防止系统崩塌。 延迟信息处理,比如10分钟之后给下单未付款的用户发送邮件提醒。解耦系统,对于新增的功能可以单独写模块扩展,比如用户确认评价之后,新增了给用户返积分的功能,这个时候不用在业务代码里添加新增积分的功能,只需...

    文章 Java架构师追风 2020-11-08 1483浏览量

  • 如何正确使用缓存?

    1 常见概念 在合理应用缓存前,需要了解缓存领域里相关的几个常用术语: 1)缓存命中:表示数据能够从缓存中获取,不需要回源; 3)Cache miss:表示没有命中缓存,如果缓存内存中还有内存空间的话,会将数据加入到缓存中; 4)存储成本:当没有命中缓存时,回源获取后会将数据放置到存储中,整个将数...

    文章 开发者社区 2019-11-25 1790浏览量

  • Gitlab从删库到恢复 - 数据库备份\恢复\容灾\HA的靠谱姿势

    标签 PostgreSQL , 节假日巡检 , 监控 , 闪回 , flash back query , trigger , event trigger , 回收站 , recycle bin , pgtranshcan , hook , _PG_init , 事件触发器 , 审计 , 跟踪 , ...

    文章 德哥 2017-02-01 15277浏览量

  • 饿了么异地双活数据库实战

    我今天分享是饿了么在数据库和多活数据库这块的实战经历,供大家参考。 主要分享以下五点: 1、多活当中的难点 2、多活的架构 3、数据库改造 4、DBA 挑战 5、收益与展望 一、多活当中的难点 我们先来看一下多活的第一个难点:要考虑做多活到底是同城的多活还是异地的多活,跨地域网络延时是现阶段很难突...

    文章 阿里云头条 2017-12-26 6731浏览量

  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    由于最近工作原因,很久没有在CSDN上留下些啥,今天在这些篇文章,是关于java多线程的。 对于JAVA多线程的应用非常广泛,现在的系统没有多线程几乎什么也做不了,很多时候我们在何种场合如何应用多线程成为一种首先需要选择的问题,另外关于java多线程的知识也是非常的多,本文中先介绍和说明一些常用的...

    文章 钟隐 2011-04-29 1815浏览量

  • 在新美大“创业”:KTV预定业务演进之路

    我们戏称KTV业务部是点评公司内的小“创业公司”,加入KTV事业部一年来,我们也像一个初创团队一样,从0开始,基本完成了KTV预订业务第一个阶段的探索。 今天从业务角度上对KTV预订的流程,以及我们在KTV预订流程发展过程中的探索给大家做一下介绍。今天的介绍主要分为如下几个大块: KTV预订业...

    文章 jurassic_1 2016-07-12 4086浏览量

  • 每周百万封业务邮件的服务器不知道为啥就down掉了?

    接着写吧,把该补得都补上! 一台承载者每周百万封业务邮件的服务器不知道为啥就down掉了??? 【poweredge 750】    是这样的,大约在很久很久以前的早上(那时候快过年了吧,好像在公司年会的前两天)我刚刚到办公室,按照常规重复的一遍又一遍的工作内容,查看监控系统的图像观察有无异常,突...

    文章 技术小胖子 2017-11-10 1226浏览量

  • 阿里云杜欢:云上Serverless开发能力将成为前端的“金手指”

    作者 | InfoQ 王文婧 云 + 端模式成为当前前端开发的新风向,由此而来的 Serverless 正帮助前端工程师提升开发能力和效率。InfoQ 记者在近日有幸在 2019ArchSummit 全球架构师峰会北京站采访到了阿里高级前端技术专家杜欢(风驰),他为我们详细梳理了阿里这两年在前端工...

    文章 木环 2020-01-03 1550浏览量

1 2 3 4 6 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT