• 关于

    实时操作系统一般会出现什么故障

    的搜索结果
  • 首次揭秘!​春晚活动下快手实时链路保障实践

    摘要:本文由快手开发工程师刘建刚分享,主要介绍春晚活动下快手实时链路保障实践。内容主要包含以下四部分: 快手 Flink 简介 春晚实时保障方案 春晚实时大屏 未来规划 Tips:点击「阅读原文」链接可查看作者原版 PPT 及分享视频~ 一、快手 Flink 简介 我们首先来看一下快手的实时...

    文章 阿里云实时计算Flink 2020-06-29 279浏览量

  • 如何设计高可用系统之故障隔离

    作者:大谷 什么是故障 简单来说,当功能或性能不符合预期,就是故障。 故障有两个比较重要的衡量指标: RPO(Recovery Point Objective):主要指的是业务系统能容忍的最大数据丢失量,针对的是数据丢失。对于资金业务来说,一般 RPO 不能大于 0 的。 RTO(Recovery...

    文章 初商 2019-08-06 802浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4711浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的智能化之路

    导言 后羿:阿里巴巴资深技术专家,参与8年双11大战,主导阿里“去IOE”战略落地,目前在推动阿里基础设施智能化。 后羿此次给大家分享的是双11的智能化网络实践,关于如何在网络智能领域通过数据手段极致地优化运营场景,在稳定性、成本、效率方面提升网络运营竞争力,给大家呈现了阿里巴巴在双11中主要依赖...

    文章 初商 2019-07-31 789浏览量

  • 基于阿里云MaxCompute实现复杂事件检测

    一、需求背景          随着信息化的不断发展,业务系统的不断完善,企业面临新的问题:1、现代工业中的输入事件流数量正成倍地增加,其中包含大量的原子事件,由原子事件构成的复合事件,甚至由复合事件构成的复杂事件。2、现代工业对于软硬件系统实时响应的要求很高,用户要求系统可以对一些关键的业务输入...

    文章 隐林 2017-04-20 1961浏览量

  • 《Storm企业级应用:实战、运维和调优》——1.1 什么是实时流计算

    本节书摘来自华章计算机《Storm企业级应用:实战、运维和调优》一书中的第1章,第1.1节,作者:马延辉 陈书美 雷葆华著, 更多章节内容可以访问云栖社区“华章计算机”公众号查看。 1.1 什么是实时流计算 所谓实时流计算,就是近几年由于数据得到广泛应用之后,在数据持久性建模不满足现状的情况下,急...

    文章 华章计算机 2017-07-03 2178浏览量

  • IBM和SAP合力打造美国的物联网时代

    OFweek物联网讯 当司机出现操作失误时汽车会自动报警;公文包会提醒主人忘带了什么东西;衣服会“告诉”洗衣机对颜色和水温的要求等等,这是国际电信联盟的一份报告曾描绘出的“物联网”时代的图景。那到底什么是物联网呢,简而言之,物联网是通过在物品上嵌入电子标签、条形码等能够存储物体信息的标识,通过无线...

    文章 寒凝雪 2017-07-03 824浏览量

  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化实践

    12月13-14日,由云栖社区与阿里巴巴技术协会共同主办的《2017阿里巴巴双11技术十二讲》顺利结束,集中为大家分享了2017双11背后的黑科技。本文是《双11的智能化网络实践》演讲整理,主要讲解了阿里巴巴在网络智能化技术中,大量级网络下网络变更、调度优化技术的大幅度提升,故障快速发现、定位、恢...

    文章 zengzengzeng 2017-12-14 1788浏览量

  • 一个系统,搞定闲鱼服务端复杂问题告警-定位-快速处理

    作者:闲鱼技术-吴白 引言 服务端问题排查(服务稳定性/基础设施异常/业务数据不符合预期等)对于开发而言是家常便饭,问题并不可怕,但是每天都要花大量时间去处理问题会很可怕;另一方面故障的快速解决至关重要。那么目前问题排查最大的障碍是什么呢?我们认为有几个原因导致:1) 大量的告警信息。2) 链路的...

    文章 闲鱼技术 2019-07-24 11570浏览量

  • 一种基于Lucene的实时搜索服务

    因为本文篇幅有限,在这里我只会着重介绍:实时性、高可用性在我们产品中的一些技术实践。实时解决方案在介绍我们产品方案之前,首先介绍下业内常见的实时解决方案,见图1-1实时架构图:图1-1该方案一般是由: 内存索引(Ram-IndexA)负责数据更新。 内存索引(Ram-IndexA)...

    文章 柳明-洪震 2018-01-26 5173浏览量

  • 连载:阿里巴巴大数据实践—实时技术

    前言:-更多关于数智化转型、数据中台内容请加入阿里云数据中台交流群—数智俱乐部 和关注官方微信公总号(文末扫描二维码或点此加入) -阿里云数据中台官网 https://dp.alibaba.com/index 来源:数智化转型俱乐部 数据价值是具有时效性的,在一条数据产生的时候,如果不能及时处...

    文章 数据中台君 2020-08-19 1270浏览量

  • 一个系统,搞定闲鱼服务端复杂问题告警-定位-快速处理

    作者|吴白出品|阿里巴巴新零售淘系技术部 服务端问题排查对开发而言是家常便饭,问题并不可怕但要花大量时间去处理;另一方面故障的快速解决至关重要。 目前问题排查最大的障碍是什么呢?我们认为有以下几个原因: 大量的告警信息。 链路的复杂性。 排查过程繁复。 依赖经验。 实际工作中的排查思路并非无迹...

    文章 淘系技术 2019-08-29 2521浏览量

  • 有货:六层混合云架构打造中国最潮生态圈

    直播视频: (点击图片查看视频) 幻灯片下载地址:https://oss.aliyuncs.com/yqfiles/7ded2aa3052bb9226fd2af0a08873750.pdf 3月18日云栖社区在线实时分享顺利结束,本次由有货CTO李建分享了有货为了应对流量的爆发式增长,对...

    文章 场景研读 2016-03-31 13789浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4455浏览量

  • 《架构师》反思:系统可靠性

    最近系统学习了一个系统可靠性及其相关知识,今天在这总结一下。 首先,什么是系统的可靠性呢?系统的可靠性是指在规定的时间内及规定的环境下完成规定功能的能力,也就是系统的无故障运行概率。 我会从以下几个方面来归纳主要内容: 1. 故障模型 2. 可靠性模型 3. 可靠性指标 4. 可靠性设计 故障模型...

    文章 胡庆访 2016-05-05 4604浏览量

  • 云场景实践研究第12期:有货

    更多云场景实践研究案例,点击这里:【云场景实践研究合集】联合不是简单的加法,而是无限的生态,谁会是下一个独角兽 随着整体业务的高速发展、流量的爆发式增长,有货对系统进行了大面积的重构。首先,数据中心从传统的单一IDC演化成为“公有云+IDC”混合模式,同时应用系统也从原来的单体全站应用演变到以微...

    文章 场景研读 2018-02-03 1443浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3370浏览量

  • 企业购买云服务器之前应该考虑哪些因素

    企业公司购买云服务器需要考虑哪些问题?首选需要对自己的业务需求进行评估,同时心里要有大概的预算,业务需求和公司预算都是决定购买云服务器配置高低的主要原因。在选择云服务器商的时候应该考虑以下问题: 1.应考虑扩展性由于网络处于不断发展之中,快速增长的应用不断对服务器租用的性能提出新的要求,为了减少更...

    文章 上云活动指导 2019-08-01 1572浏览量

  • LinkedIn 开源其分布式对象存储系统 Ambry

    日前,LinkedIn在Github上基于Apache 2许可证协议开源了其分布式对象存储系统Ambry。Ambry是一个是不可变对象的存储系统,非常易于扩展,它能够存储KB到GB大小的不可变对象,并且能够实现高吞吐和低延迟,该系统支持跨数据中心的双活部署,并且存储成本低廉。它特别适于存储各种媒体...

    文章 沉默术士 2017-07-03 1843浏览量

  • 业务系统对消息中间件的要求(接上一篇《分布式消息中间件中的一些概念》)

      在大型互联网中,主要采用消息中间件来进行业务的解耦和操作的异步化,这也是消息中间件最基础的特点,也是业务系统对消息中间件的最基本需求。   在这个基础之上,本篇来谈一下业务系统从功能、性能等各个方面对消息中间件的需求。   功能 功能需求核心的其实就发送消息和消费消息,细化下去,发送需求会有同...

    文章 蘑菇街隐修 2017-07-01 611浏览量

  • 数据中心“容灾”和“备份”的区别

    云栖号:https://www.aliyun.com/#module-yedOfott8第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策! 数据中心运行突发故障(如:天灾不可避免的灾难)是无法预测的,计算机里的数据就像扫雷游戏一样,十面埋伏充满雷...

    文章 云栖号资讯小编 2019-12-17 5180浏览量

  • 阿里:千亿交易背后的0故障发布

    前言 近几年,我们在发布效率和稳定性方面做了不少工作,其中效率简单的说就是发布耗时,一个是发布的速度,比如一个应用是1个小时发布完成,还是5分钟发布完成?另一个是人员介入,开发在发布过程中是否需要介入处理各种发布过程中出现的问题?这两者都做好了,才能说是发布效率提升了。稳定性最基础的是系统的稳定性...

    文章 阿里云头条 2018-04-20 4980浏览量

  • 趣头条基于 Flink+ClickHouse 构建实时数据分析平台

    作者:王金海@趣头条 摘要:本文由趣头条数据平台负责人王金海分享,主要介绍趣头条 Flink-to-Hive 小时级场景和 Flink-to-ClickHouse 秒级场景,内容分为以下四部分: 一、业务场景与现状分析 二、Flink-to-Hive 小时级场景 三、Flink-to-Click...

    文章 阿里云实时计算Flink 2020-04-02 2412浏览量

  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里巴巴研发效能事业部技术专家。目前从事运维中台(阿里内部叫诺曼底)建设方面的工作,是集...

    文章 云效平台 2018-04-18 3290浏览量

  • HBase的引出

    行式存储和列式存储 如上图,第一个行式存储是以行为单位存储数据,三个颜色的代表三个不同行数据,而下面的是列式存储,以列为单位存储数据,四个颜色代表四个不同的列,箭头也是用来表示数据是如何存储的 在传统的RDBMS(关系型数据库)中,保存着一条完整的数据,如果查询数据的某列,需要将这行数据查询出...

    文章 期待l 2018-11-30 1209浏览量

  • 《Oracle数据库性能优化方法论和最佳实践》——1.4 Oracle性能优化工作的分类

    本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第1章,第1.4节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看 1.4 Oracle性能优化工作的分类 在Oracle上进行性能优化时,不同场景下的优化工作方法和内容有很大的不同。...

    文章 华章计算机 2017-05-02 1510浏览量

  • 打造更适合IoT场景的消息队列实践

    作者:阿里云智能IoT事业部 高级技术专家 吕建文 随着接触客户越来越多,也越来越颠覆了我对“传统队列”(kafka、rocketmq、rabbitmq...)的看法。 当然本文不是说“传统队列”做得不好, 这些队列系统经过多年打磨,在高性能、海量堆积、消息可靠性等诸多方面都已经做得非常极致了,都...

    文章 阿里云AIoT 2020-01-18 1630浏览量

  • 线上广告投放出现bug,如何实时发现?

    作者 | 大倪 一、背景 电商平台的搜索广告数据处理链路通常较长,一般会经历如下过程: 广告主在后台进行广告投放; 投放广告品及关键词数据写入数据库; 数据库中的数据通过全量构建(导入数据仓库再进行离线批处理)或增量构建(借助消息队列和流计算引擎)的方式产出用于构建在线索引的“内容文件”...

    文章 剑曼红尘 2019-12-29 378浏览量

  • 双11数据大屏背后:大规模流式增量计算及应用(附资料)

    首先从理解什么是数据流开始今天的分享,其实在真实的世界中,大部分的数据都是连续产生的数据流,比如手机上产生的GPS信号、用户在互联网上的行为、在线搜索、用户的点击、社交网络分享、即时通信以及一些传感器和物联网设备采集的日志信息等,这些数据都是连续产生的,自然就形成了数据流,在这些数据流产生以后,在...

    文章 小旋风柴进 2017-05-22 1557浏览量

  • 有赞实时任务优化:Flink Checkpoint 异常解析与应用实践

    作者:沈磊(有赞大数据) 有赞实时任务主要以 Flink 为主,为了保证实时任务的容错恢复以及停止重启时的状态恢复,几乎所有的实时任务都会开启 Checkpoint 或者触发 Savepoint 进行状态保存。由于 Savepoint 底层原理的实现和 Checkpoint 几乎一致,本文结合 F...

    文章 阿里云实时计算Flink 2020-03-11 886浏览量

1 2 3 4 ... 13 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务