调度模型常见故障

  • 好玩又实用,阿里巴巴开源混沌工程工具 ChaosBlade

    减少故障的最好方法就是让问题经常性的发生。在可控范围或环境下,通过不断重复失败过程,持续提升系统的容错和弹性能力。 那么,实施一次高效的混沌工程实验,需要几步呢? 答案:2 步。 ① 登陆 ChaosBlade ② 下载 release 版本,打造故障演练专属工具 高可用架构是保障服务稳定性的核...

    文章 中间件小哥 2019-03-28 11841浏览量

  • 六年打磨!阿里开源混沌工程工具 ChaosBlade

    阿里妹导读:减少故障的最好方法就是让故障经常性的发生。通过不断重复失败过程,持续提升系统的容错和弹性能力。今天,阿里巴巴把六年来在故障演练领域的创意和实践汇浓缩而成的工具进行开源,它就是 “ChaosBlade”。如果你想要提升开发效率,不妨来了解一下。 高可用架构是保障服务稳定性的核心。 阿里巴...

    文章 技术小能手 2019-03-28 9444浏览量

  • 伏羲—阿里云分布式调度系统

    今天,大数据已经从概念发展到在很多行业落地生根。广泛用在电商、金融、企业等行业,帮助行业分析数据、挖掘数据的价值。即使在传统的医疗、安全、交通等领域也越来越多的应用大数据的技术。数据、价值二者之间的联系是计算,计算是大数据中最核心的部分。大数据计算就是将原来一台台的服务器通过网络连接起来成为一个整...

    文章 场景研读 2016-12-21 15491浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    0元试用32+款产品,最高免费12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 阿里云马劲:保证云产品持续拥有稳定性的实践和思考

    对所有的技术人员来说,业务可靠性提升是一个系统工程,涉及网络管理、IDC管理、服务器管理、交付管理、变更管理、故障管理、监控管理、预案管理、根因分析、容量规划、容灾演练、标准化建设、集成测试、泛操作管理、权限管理、数据安全管理等方方面面,随着先进技术的应用、业务云化、微服务化等,业务架构变得更加复...

    文章 云攻略小攻 2018-12-06 15273浏览量

  • 走近伏羲,谈5000节点集群调度与性能优化

    5K项目是飞天平台的里程碑,系统在规模、性能和容错方面都得到了飞跃式的发展,达到世界领先水平。伏羲作为飞天平台的分布式调度系统,能支持单集群5000节点,并发运行10000作业,30分钟完成100TB数据Terasort,性能是当时Yahoo ! 在Sort Benchmark上世界纪录的两倍。 ...

    文章 yq传送门 2016-12-18 4123浏览量

  • 八年来我们到底经历了什么?——中间件专家带你“重走”双11高可用架构演进之路

    双11的技术挑战 双11技术挑战的本质使用用有限的成本去是实现最大化的用户体验和集群整体吞吐能力,用最合理的代价解决零点峰值,支撑好业务的狂欢。阿里做双11已经有八年之久了,八年来双11的交易额增长200倍,交易峰值增长400多倍,系统复杂度和大促支撑难度以指数级攀升;并且经过多年的发展,双11技...

    文章 场景研读 2017-08-04 7550浏览量

  • 高性能负载均衡设计与实现

    2017阿里云网络技术高峰论坛在线技术峰会,阿里云卫峥带来题为高性能负载均衡设计与实现的演讲。本文主要从早期的负载均衡开始谈起,进而讲解了高性能负载均衡,着重分析了LVS和Tengine,以及如何做到高可用,最后作了简要总结。   以下是精彩内容整理: 负载均衡 负载均衡是云计算的基础组件,是网络...

    文章 场景研读 2017-09-28 10685浏览量

  • 面向大数据与云计算调度挑战的阿里经济体核心调度系统—Fuxi 2.0全揭秘

    本文作者 李超 阿里云智能 资深技术专家 编者按 伏羲(Fuxi)是十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),当时的设计初衷是为了解决大规模分布式资源的调度问题(本质上是多目标的最优匹配问题)。 随阿里经济体和阿里云丰...

    文章 晋恒 2020-05-13 2020浏览量

  • 面向大数据与云计算调度挑战的阿里经济体核心调度系统—Fuxi 2.0全揭秘

    本文作者 李超 阿里云智能 资深技术专家 编者按 伏羲(Fuxi)是十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),当时的设计初衷是为了解决大规模分布式资源的调度问题(本质上是多目标的最优匹配问题)。 随阿里经济体和阿里云丰...

    文章 晋恒 2020-05-13 1380浏览量

  • 宜信微服务任务调度平台建设实践

    内容来源:宜信技术学院第4期技术沙龙-线上直播|宜信微服务任务调度平台建设实践 主讲人:宜信高级架构师&开发平台负责人 梁鑫 导读:如今,无论是互联网应用还是企业级应用,都充斥着大量的批处理任务,常常需要一些任务调度系统帮助我们解决问题。随着微服务化架构的逐步演进,单体架构逐渐演变为分布...

    文章 宜信技术学院 2019-10-22 1732浏览量

  • 容器化应用的服务可用性

    本文讲的是容器化应用的服务可用性【编者的话】高可用性的容器化应用是指服务可用性(连续运行时间)。本文介绍了如何借助于容器管理工具来监控和测量服务。【烧脑式Kubernetes实战训练营】本次培训理论结合实践,主要包括:Kubernetes架构和资源调度原理、Kubernetes DNS与服务发现、...

    文章 猫饭先生 2017-10-10 1058浏览量

  • 首次揭秘!​春晚活动下快手实时链路保障实践

    摘要:本文由快手开发工程师刘建刚分享,主要介绍春晚活动下快手实时链路保障实践。内容主要包含以下四部分: 快手 Flink 简介 春晚实时保障方案 春晚实时大屏 未来规划 Tips:点击「阅读原文」链接可查看作者原版 PPT 及分享视频~ 一、快手 Flink 简介 我们首先来看一下快手的实时...

    文章 阿里云实时计算Flink 2020-06-29 219浏览量

  • 《大数据管理概论》一1.4 大数据的处理模式

    本节书摘来自华章出版社《大数据管理概论》一书中的第1章,第1.4节,作者 孟小峰,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.4 大数据的处理模式 无论是工业界还是学术界,都已经广泛使用高级集群编程模型来处理日益增长的数据,如MapReduce。这些系统将分布式编程简化为自动提供位置...

    文章 华章计算机 2017-05-02 1476浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3230浏览量

  • web服务处理过程,各种I/O模型详解,

    一, 进程,线程? 进程是具有一定独立功能的,在计算机中已经运行的程序的实体。在linux2.4以前,进程是基本运作的单位,在只是线程的系统中,线程才是最基本的运作单位,而进程只是线程的容器,程序本身只是指令,数据及其组织形式的描述,进程才是程序的真正运行实例。若干进程有可能在同一程序相关,且每个...

    文章 余二五 2017-11-15 807浏览量

  • 《云计算:原理与范式》一1.7 平台即服务供应商

    1.7 平台即服务供应商 作为一个服务供应商的公共平台,通常会提供一个开发和部署环境,使用户能够创建和运行他们的应用。用户很少或者根本不会关注平台的低层次细节。此外,在该平台中可以使用特定的编程语言和框架以及其他服务,例如持久性数据存储和内存中的缓存。 1.7.1 特点 编程模型、语言和框架。Ia...

    文章 华章计算机 2017-08-01 1075浏览量

  • k8s重要概念

    kubernetes架构图 下图为kubernetes的master架构图 1. Cluster cluster是计算、存储和网络资源的集合,kubernetes利用这些资源运行各种基于容器的应用。 2. Master Master 是Cluster的大脑,它的主要职能就是负责调度,决定应用放...

    文章 朗月清风hyj 2019-04-20 911浏览量

  • 提升 10 倍!阿里云对象存储 OSS 可用性 SLA 技术揭秘

    一 概述 阿里云对象存储 OSS 通过十年积累的技术红利,长期在双十一淘宝应用如丝般顺滑体验需求的打磨下,2020 年 6 月将可用性 SLA 提升 10 倍,其中 OSS 标准型(同城冗余)存储,SLA 从 99.95% 提升到 99.995%,简单理解能支持 10 万张图片最多只有 5 个显...

    文章 茶什i 2020-07-02 456浏览量

  • 基于MaxCompute/Dataworks实现数据仓库管理与全链路数据体系

    前言   就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家。也有很多伙伴执迷于数据,成为了行业的数据研发专家。当然还有很多小伙伴,热衷于工具系统开发,成为了数据技术专家。那么我们回过头来考虑,什么是大数据,什么又是数据仓库,什么又是数据技术。大数据其实是个...

    文章 隐林 2019-04-28 1795浏览量

  • SQL Server 2005架构

    转载自:http://blog.csdn.net/motian_shi/article/details/4071616 SQL Server 2005由协议层、关系引擎、存储引擎以及SQL OS四层组成。 协议层主要负责接收和传送SQL Server服务器端和客户端之间的消息,同是也要负责将这...

    文章 技术小甜 2017-11-15 1083浏览量

  • 从容器到云原生 – 服务网格

    为云栖社区总监课系列准备的课件讲义,面向开发者入门向讲解云原生的一些实践经验和发展方向。 视频: 从容器到云原生 – 极致弹性 视频: 从容器到云原生 – 服务网格 容器技术的发展揭开了云原生计算的序幕: 首先是应用的容器化,Heroku/CloudFoundry 等PaaS平台基于容器技...

    文章 易立 2018-12-18 3672浏览量

  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统工作原理

    据报导,在短短四年间,Uber已经惊人地增长了38倍。现在,Uber的首席系统架构师Matt Ranney 在他的报告“可伸缩Uber实时市场平台”中,对Uber软件系统的工作原理进行了一个有趣而又详细的介绍。 如果你对Uber迅猛增长的单价感兴趣,这个并没有在报告中涉及。但是我们可以了解Uber...

    文章 技术小能手 2017-11-20 1660浏览量

  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统工作原理

    据报导,在短短四年间,Uber已经惊人地增长了38倍。现在,Uber的首席系统架构师Matt Ranney 在他的报告“可伸缩Uber实时市场平台”中,对Uber软件系统的工作原理进行了一个有趣而又详细的介绍。 如果你对Uber迅猛增长的单价感兴趣,这个并没有在报告中涉及。但是我们可以了解Ube...

    文章 readygo 2016-03-17 3417浏览量

  • AKKA文档(java)——角色系统

    原文:http://doc.akka.io/docs/akka/2.3.6/general/actor-systems.html  译者:吴京润 角色是封装了状态与行为的对象,它们通过交换放入接收者信箱的消息实现两两之间的通讯。从某种意义上说,角色是最严格的面向对象编程,不过最好还是把它们当作人来...

    文章 ali清英 2016-04-06 1094浏览量

  • 云原生高可用技术体系构建

    以下是视频内容的精华整理。 伴随着互联网业务的高速发展,越来越多的线下场景需要转移到线上,而线上业务的量级飞速增长,也给互联网业务的技术架构带来了严峻挑战,原来的“一体机+数据库”的方式已经不适用于当前的主流业务,越来越来的业务开始向分布式架构和云原生架构演进。同时,原来单一的技术环境开始走向分布...

    文章 영~ 2020-06-18 280浏览量

  • AKKA文档(java)——角色系统

    角色是封装了状态与行为的对象,它们通过交换放入接收者信箱的消息实现两两之间的通讯。从某种意义上说,角色是最严格的面向对象编程,不过最好还是把它们当作人来看待:当用角色为一个方案建模时,想象有一群人,并给他们分配了任务,他们在一个组织结构中发挥职能作用,并想象如何做到故障升级(就像在不需要考虑实际利...

    文章 青衫无名 2017-05-23 1067浏览量

  • 阿里云对象存储 OSS 发布全球第一可用性 SLA 背后的技术体系

    一、概述2020年6月,阿里云对象存储 OSS 通过十年积累的技术红利,将可用性 SLA(Service Level Agreement) 提升 10 倍,做到了全球第一的核心竞争力,是其他的云厂家的 10~20 倍,如下图所示。其中, OSS 的标准型(同城冗余)存储,SLA 从 99.95% ...

    文章 阿里巴巴存储技术 2020-06-17 171浏览量

  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生时代”的全面升级

    本文节选自《不一样的 双11 技术:阿里巴巴经济体云原生实践》一书 作者:周小帆(承嗣)  阿里云中间件技术部高级技术专家王华锋(水彧)  阿里云中间件技术部技术专家徐彤(绍宽)  阿里云中间件技术部技术专家夏明(涯海)  阿里云中间件技术部技术专家 导读:作为一支深耕多年链路追踪技术 (Trac...

    文章 阿里巴巴云原生小助手 2019-12-20 355浏览量

  • 阿里云基础产品技术月刊 2019年2月

    关注更多内容,点击订阅月刊 一、商用产品技术TOP1 弹性伸缩推出目标追踪伸缩规则,让用户使用更精准、快速、易用的策略响应业务负载变化弹性伸缩服务在简单伸缩规则的基础上,通过与云监控深度合作,上线了目标追踪伸缩规则。相比于简单伸缩规则定义较模糊、调整粒度固定、调整过程缺少控制等不足之处,目标追踪伸...

    文章 宝惜 2019-03-13 2796浏览量

  • 新浪微博上云实践:极端流量下的峰值应对与架构挑战

    本文正在参加“最佳上云实践”评选,来给我们投票吧:https://yq.aliyun.com/activity/158(编号1) 做为目前最火的国内社交APP,微博常常在特定时间或特定事件发生时迎来流量高峰。通过对近五年时间应对的峰值进行总结,可以抽象为三种常见的峰值:  第一种是日常的晚高...

    文章 weibo_rd 2017-02-26 7309浏览量

1 2 3 4 ... 9 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板