• 关于

    故障容限会出现哪些问题

    的搜索结果
  • 《路由设计的优化》一1.3 可靠性和弹性

    本节书摘来自异步社区《路由设计的优化》一书中的第1章,第1.3节,作者【美】Russ White , Don Slice , Alvaro Retana,更多章节内容可以访问云栖社区“异步社区”公众号查看 1.3 可靠性和弹性 路由设计的优化如果网络不转发网络设备之间的数据,那么应用程序就无法正常...

    文章 异步社区 2017-05-02 1095浏览量

  • 阿里搜索事业部故障快速恢复实践

    这篇文章中,我们将讨论面对故障时,我们为什么选择快速切流这种机制。如果选择快速切流,我们需要具备哪些条件,需要切流平台解决什么样的问题。最后,我们畅想故障快速恢复未来如何做的更好。 一、关于故障的几种解决思路 如何定义故障 我们一般从以下几个维度来定义故障。一是影响的用户数量,例如用户投...

    文章 卢占一十力 2018-03-16 2399浏览量

  • 应用容灾中,MySQL数据表是否需要跨云同步?

    作者 | 向迪来源 | 阿里技术公众号一 背景容灾系统的重要目标在于保证系统数据和服务的“连续性”。当系统发生故障时,容灾系统能够快速恢复服务和保证数据的有效性。为了防止天灾人祸、不可抗力,在同城或异地建立对应的IT系统,其中最核心的工作是数据同步。本文选取应用层容灾的场景中,对于哪些数据表需要...

    文章 开发者小助手_LS 2021-03-12 3528浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 八年来我们到底经历了什么?——中间件专家带你“重走”双11高可用架构演进之路

    双11的技术挑战 双11技术挑战的本质使用用有限的成本去是实现最大化的用户体验和集群整体吞吐能力,用最合理的代价解决零点峰值,支撑好业务的狂欢。阿里做双11已经有八年之久了,八年来双11的交易额增长200倍,交易峰值增长400多倍,系统复杂度和大促支撑难度以指数级攀升;并且经过多年的发展,双11技...

    文章 场景研读 2017-08-04 7645浏览量

  • 阿里企业级分布式应用服务EDAS产品解密

    2016云栖大会上海峰会于2016.1.20日在上海科技馆顺利举办。本文根据阿里高级技术专家赵林(花名:丹臣)在“云栖大会上海峰会”专场《“互联网+”架构及实践专场-企业级信息系统云化演进之路》中的演讲整理。赵林在演讲中主要为大家详细介绍了阿里企业级分布式应用服务器EDAS产品。  企业级分布式应...

    文章 中间件小哥 2016-04-08 2519浏览量

  • 阿里集团搜索和推荐关于效率&稳定性的思考和实践

    背景 效率和稳定性是我们从工程层面来衡量系统对业务支持能力的两个关键指标。从流程管控上来看,业务效率的提升一定程度上会影响到稳定性,而对稳定性要求过高又会带来对业务效率的影响。从业务的角度来看,成熟的业务会更偏向于稳定性,而新业务更偏向于效率。效率和稳定性兼顾,也就变成了一个巨大的挑战。 我们理解...

    文章 李伟-剑豪 2018-02-11 5031浏览量

  • 阿里赵林:阿里企业级分布式应用服务EDAS产品解密

    2016云栖大会上海峰会于2016.1.20日在上海科技馆顺利举办。本文根据阿里高级技术专家赵林(花名:丹臣)在“云栖大会上海峰会”专场《“互联网+”架构及实践专场-企业级信息系统云化演进之路》中的演讲整理。赵林在演讲中主要为大家详细介绍了阿里企业级分布式应用服务器EDAS产品。下面是演讲内容整理...

    文章 云学习小组 2016-01-25 8424浏览量

  • 阿里如何做好双11技术保障?大队长霜波分享4点经验

    每年双11都是一个比较艰难的项目。我现在的职位是阿里集团的技术风险负责人,所谓技术风险就是稳定性的保障是我这边负责的。对阿里巴巴来说,对整个经济体来说,每年技术风险最大的一次就是双11。 为什么说双11是每年技术保障稳定性最困难的一次?每年双11我们都会向大家分享交易额是多少,连续12年的数字大...

    文章 开发者小助手 2021-01-06 273浏览量

  • 阿里如何做好双11技术保障?大队长霜波分享4点经验

    作者 | 霜波 左延鹊来源 | 阿里技术公众号每年双11都是一个比较艰难的项目。我现在的职位是阿里集团的技术风险负责人,所谓技术风险就是稳定性的保障是我这边负责的。对阿里巴巴来说,对整个经济体来说,每年技术风险最大的一次就是双11。 为什么说双11是每年技术保障稳定性最困难的一次?每年双11我们都...

    文章 开发者小助手_LS 2021-01-06 2339浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4746浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的智能化之路

    导言 后羿:阿里巴巴资深技术专家,参与8年双11大战,主导阿里“去IOE”战略落地,目前在推动阿里基础设施智能化。 后羿此次给大家分享的是双11的智能化网络实践,关于如何在网络智能领域通过数据手段极致地优化运营场景,在稳定性、成本、效率方面提升网络运营竞争力,给大家呈现了阿里巴巴在双11中主要依赖...

    文章 初商 2019-07-31 810浏览量

  • 为什么说中小公司自建Redis是一件不太靠谱的事情?

    上段时间,和数据库领域的一些朋友交流,他告诉云栖社区,XX厂商自建Redis出问题了,并表示最近不少自建Redis的中小公司也都陆续出问题。 对于为什么会出现这样现象,云栖社区记者就此采访了阿里云数据库高级技术专家子嘉,他谈了问题的根源——自建Redis的缺点: 可靠性低:如果数据走云盘做高可靠...

    文章 身行 2016-11-03 6322浏览量

  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化实践

    12月13-14日,由云栖社区与阿里巴巴技术协会共同主办的《2017阿里巴巴双11技术十二讲》顺利结束,集中为大家分享了2017双11背后的黑科技。本文是《双11的智能化网络实践》演讲整理,主要讲解了阿里巴巴在网络智能化技术中,大量级网络下网络变更、调度优化技术的大幅度提升,故障快速发现、定位、恢...

    文章 zengzengzeng 2017-12-14 1798浏览量

  • 《Oracle数据库性能优化方法论和最佳实践》——1.4 Oracle性能优化工作的分类

    本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第1章,第1.4节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.4 Oracle性能优化工作的分类 在Oracle上进行性能优化时,不同场景下的优化工作方法和内容有很大的不同。...

    文章 华章计算机 2017-05-02 1528浏览量

  • 独立开发一个云(PaaS)的核心要素, Go, Go, Go!!!

    最近一年的工作,有很大的比重在做云平台的事情,简单来说,就是为公司内用户提供一个PaaS,用户可以在我们的云平台上方便的将单机服务程序扩展为多实例程序,以平台服务化的方式对外提供。在这里简单分享一下。 首先简单说一下我们解决了用户的什么需求,或者说痛点。 基础算法直接以库的形式提供给应用方? 用户...

    文章 anzhsoft 2015-10-10 2100浏览量

  • 2017QCon分享:从淘宝到云端的高可用架构演进

    大家好,我今天分享的题目是《高可用实践:从淘宝到上云的差异》,取这个标题是因为会涉及到两个方面内容,一方面以淘宝为例子,传统的IDC的时候,我们稳定性是怎么做的,另外在云计算背景下,有很多创业公司是基于阿里云这样的公有云基础设施做研发,在公有云的环境下怎么做好我们系统的高可用。 长期做稳定性的人...

    文章 王晨纯 2017-10-25 2912浏览量

  • 纯干货 | 从淘宝到云端的高可用架构演进

    近日在Qcon开发者大会北京站上,来自阿里巴巴商家事业部技术专家沐剑在专场分享了题为《高可用实践:从淘宝到上云的差异》的演讲,主要介绍了其近几年在阿里电商平台及阿里云上的高可用设计的经验,分为两个部分:第一部分主要包括传统的淘宝店铺稳定性体系的建设及相关的基础链路设计、缓存和容灾方案的设计及部署;...

    文章 技术小能手 2017-06-19 2034浏览量

  • 钉钉猛增40倍流量压力 阿里云DBA如何应对

    1.背景 由于受新型冠状病毒感染的肺炎疫情影响,钉钉流量从春节后开始出现了飞跃性增长。此次疫情流量主要来源于钉钉远程办公和在线教育功能,从字面来看,好像只是钉钉的两个业务功能,但在钉钉内部依赖模块不下20个,主要有消息、视频会议、直播、家校、健康打卡等业务场景。如何保障超过20个业务在如此爆发式增...

    文章 SRE团队技术小编-小兰 2020-09-03 2953浏览量

  • 微博热点事件背后数据库运维的“功守道”

    作者:张冬洪 背景&挑战 背景 正是图1这条微博动态,让一个平常的国庆假期变得不同寻常,微博刚一发出就引爆网络,它将明星CP动态推向了舆论的高潮,并霸占微博热搜榜好几天,也正是因为这个突发的流量,致使流量过大一度引发微博服务器瘫痪,而成为吃瓜群众热议的话题。微博拥有超过3.76亿月活用...

    文章 zhangdh1113 2018-09-27 1241浏览量

  • 面向失败的设计-概述

    一、引言 一个优秀的架构师通常都是一个悲观主义者,除了设计好能够支撑业务持续发展的优雅架构,另一个容易被忽略的重要能力在于充分考虑失败场景。如果对失败场景考虑不够充分,轻则出现业务不可用,影响用户体验和企业声誉;重则导致数据永久丢失、业务再无恢复可能。2001 年 9 月 11 日,美国世贸中心双...

    文章 KB小秘书 2019-11-08 996浏览量

  • 如何做好一名稳定性SRE--业务团队系统稳定性的思与行

    前言 2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫、盒马从事中间件、业务系统、架构等方面的工作,期间一直穿插着负责稳定性和大促的保障工作。我的心态,大致经历过以下几个阶段: low:完全不懂,觉得稳定性就...

    文章 茶什i 2020-10-26 2360浏览量

  • 双 11 猫晚直播:看阿里文娱如何“擒住”高并发、多视角、 低卡顿!

    作者| 阿里文娱技术专家 泫野 在全民互动、红包与优惠券齐飞的双 11 盛会之下,对于阿里内部而言,实则是「练兵千日 磨一剑,用兵一时见功夫」的实战训练场。对此,阿里巴巴集团董事局主席兼首席执行官张勇(逍遥子)也曾说过,「没有参加过双 11 的叫同事,参加过双 11 的叫战友」。而如今这场以技术...

    文章 千言万语乐此不疲 2020-05-27 437浏览量

  • 为了30分钟配送,盒马工程师都有哪些“神操作”?

    阿里妹导读:提到盒马鲜生,除了新鲜的大龙虾以外,大家印象最深的就是快速配送:门店附近3公里范围内,30分钟送货上门。 盒马是基于规模化和业务复杂度两个交织,从IT到DT,从原产地到消费者而形成的端到端的平台,而盒马配送更是集成IOT、智能化、自动化等到线下作业,同时受不可抗力因素雨雪冰雾、道路交通...

    文章 技术小能手 2019-03-19 5501浏览量

  • 为什么说优秀架构师往往是一个悲观主义者?

    阿里妹导读:18年前,200家企业由于在事故中信息系统遭到严重破坏而永远地关闭了。这样的事故引发了后人深思,对于工程师而言,不仅要求设计的系统足够强壮,还需要具备考虑失败的能力,当失败场景悉数被考虑周全、并且结合充分的演练,一切会不会不一样?我们熟知面向对象设计和面向程序设计,阿里巴巴资深技术专家...

    文章 技术小能手 2019-06-18 24345浏览量

  • 如何通过 Serverless 提高 Java 微服务治理效率?

    作者 | 王科怀(行松)来源 | 阿里巴巴云原生公众号微服务治理面临的挑战在业务初期,因人手有限,想要快速开发并上线产品,很多团队使用单体的架构来开发。但是随着公司的发展,会不断往系统里面添加新的业务功能,系统越来越庞大,需求不断增加,越来越多的人也会加入到开发团队,代码库也会增速的膨胀,慢慢的单...

    文章 阿里巴巴云原生小助手 2021-03-08 1885浏览量

  • 阿里云双11访谈之云数据库

    以下内容根据访谈视频整理而成。 阿里云数据库产品特性介绍 云数据库产品在阿里云集团里做了很多额外的工作和专研。在安全线上云数据库达到了很高的安全要求,引入了更多的硬件,在架构上、在代码层都做了很多的优化。相对于传统数据出来说,云数据库在稳定性和高可用上面达到了较高的技术上的提升。阿里云产品都有一个...

    文章 场景研读 2017-11-01 6757浏览量

  • 世界杯千万级直播高稳定的挑战和实践

    今年夏天,俄罗斯世界杯召开。在刚刚落幕的重庆云栖飞天技术汇专场中,阿里视频云技术专家裘良科,就世界杯这个话题,跟参会嘉宾一起探讨了千万级直播高稳定的挑战和相关实践,本文为演讲全文。 2018年俄罗斯世界杯从6月14日到7月15日,跨度整整一个月,共有64场比赛,优酷成为央视指定的世界杯新媒体官方...

    文章 樰篱 2018-09-06 2290浏览量

  • 分布式服务架构下的混沌工程实践

    本文来自阿里巴巴高可用架构团队高级开发工程师肖长军(花名穹谷)在 GIAC(全球互联网架构大会)上的分享,包含三部分内容:(阿里巴巴中间件公众号对话框发送“混沌工程”,获取分享PPT) 混沌工程的定义、价值、原则和流程; 混沌工程如何在企业中落地,以及 ChaosBlade 和混沌实验平台 AH...

    文章 中间件小哥 2019-07-04 17662浏览量

  • 阿里高可用架构建设实践经验

    本文始发于:云栖社区时间:2020-06-02原文链接:https://yq.aliyun.com/articles/763336 1 背景 随着业务在线化互联网化的高速发展,企业对核心业务系统的稳定性、可靠性、有效性、业务连续性等有了更高的要求。采用高可用系统架构支持重要系统、为关键业务提供7x...

    文章 SRE团队技术小编-小兰 2020-08-31 1128浏览量

  • 限流和降级(上) | 如何打造平台稳定性能力(一)

    在整个稳定性体系中,所包含的范围非常广泛,从机房的布线、网络通信、硬件部署、应用架构、数据容灾等方面都与之相关。从共享服务中台的角度看,则更多的是从应用架构设计和中间件平台的维度对平台的稳定性实现更精确化的管理和保障。本期开始,我们将从这个角度介绍阿里巴巴中间件团队多年来为了提升平台稳定性所做出的...

    文章 中间件小哥 2018-08-16 4663浏览量

1 2 3 4 ... 7 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT