• 阿里、Uber都在用的Flink你了解多少?

    Flink支持流处理和窗口事件时间语义。事件时间可以很容易地通过事件到达的顺序和事件可能的到达延迟流中计算出准确的结果。Flink的事件机制示意图 3.窗口机制 Flink支持基于时间、数目以及会话的非常灵活的窗口机制...
    文章 2018-09-13 3742浏览量
  • 《Cisco IOS XR技术精要》一1.3 操作系统概念

    可提供的基本功能包括进程调度、中断处理、内存管理、进程间通信,以及常见例行程序(常见库)。本节将对操作系统的这些基本功能做更详细的介绍。1.进程调度所谓进程(process),是指在具有执行多程序实例能力的...
    文章 2017-05-02 1918浏览量
  • Apache Flink实战(一)-初识Flink

    复杂事件处理(CEP):模式检测是事件流处理的一个非常常见的用例。Flink的CEP库提供了一个API来指定事件模式(想想正则表达式或状态机)。CEP库与Flink的DataStream API集成,以便在DataStream上评估模式。CEP库的...
    文章 2019-06-15 2409浏览量
  • 下一代数据中心架构(第2版)》一1.6 故障排查

    虽然可以利用 debug工具来跟踪事件、内部消息以及协议差错情况,但是在实际生产环境中使用 debug工具时必须特别小心,因为某些命令选项可能会给控制台生成过量消息,以至于无法访问设备,也可能会产生大量CPU敏感型...
    文章 2017-05-02 1390浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    Checker负责发现故障,发现故障后产生故障事件,Master处理Checker发现的事件,派发相应的动作给Worker,Worker负责执行具体Action(短期)或者Task(长期运行);同时如果满足条件,将进行状态迁移。每个对象的状态...
    文章 2016-12-18 4692浏览量
  • “全天候”的服务台才是“事件”的主人

    但已经具备了IT服务台的功能,而且,有些在企业中还有了“智能化服务台”的功能,能够处理大部分的常见问题,自动监控基础架构的报警功能,并结合知识 库提供故障诊断分析等。慢慢就过渡到了以ITIL为标准的IT 服务台...
    文章 2017-11-07 942浏览量
  • Flink最佳实践(一)流式计算系统概述

    不论是基于事件时间的窗口还是基于处理时间的窗口,都会有不同的窗口类型可以使用,常见的如:固定窗口、滑动窗口、会话窗口 等。固定窗口 按照固定的时间片划分数据流,将数据流 分割成具有固定大小的片段。如图所...
    文章 2019-11-19 1773浏览量
  • 《IT运维之道》——3.2 IT运维服务的原则

    (4)运维管理者通过定期汇总分析常见故障和突发事件量及事件完成质量,了解流程规范执行的落实效果,并在此效果基础上持续改进。3.2.4 重控制重控制是为了控制运维服务质量达到运维服务承诺的要求而开展的工作。...
    文章 2017-05-02 1994浏览量
  • 面试被问微服务答不上?分享微服务设计指南,你有什么...

    “哑”管道的“哑”其实就是体现在微服务的通信过程尽量简单,不要让通信机制有“思考能力”,不在其中加入过多的处理机制,反例是SOA时代的ESB产品,ESB产品通常会包含复杂的设施用于消息路由,编排和转换,以及...
    文章 2020-04-14 457浏览量
  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的...

    网络故障处理全面进入自动化处理和智能化调度时代,60%以上的风险隐患已经实现了自动化处理,大大降低了问题处理时长,实现故障的快速恢复。自恢复是一种怎样的体验?当监控系统探知到一个具体故障正在发生时,就会...
    文章 2018-01-05 4849浏览量
  • 业界|Airbnb的变更数据捕获系统,实现数据突变实时...

    为了通过可配置的容错来提升高可用性,每个源都被指定为集群节点的某个子集来处理事件流。我们使用Leader-Standby状态模型,其中只有一个节点在任何给定点流式传输来自源的事件,而子群集中的其余节点处于待命状态。...
    文章 2018-09-27 1177浏览量
  • 基础设施助力双11(十):百万级物理和虚拟网络设备的...

    网络故障处理全面进入自动化处理和智能化调度时代,60%以上的风险隐患已经实现了自动化处理,大大降低了问题处理时长,实现故障的快速恢复。自恢复是一种怎样的体验?当监控系统探知到一个具体故障正在发生时,就会...
    文章 2019-07-31 946浏览量
  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化...

    网络故障处理全面进入自动化处理和智能化调度时代,60%以上的风险隐患已经实现了自动化处理,大大降低了问题处理时长,实现故障的快速恢复。自恢复是一种怎样的体验?当监控系统探知到一个具体故障正在发生时,就会...
    文章 2017-12-14 1853浏览量
  • 《Storm分布式实时计算模式》——2.1 Storm集群的...

    包括topology的发布,任务指派,事件处理失败时重新指派任务。将topology发布到Strom集群,将预先打包成jar文件的topology和配置信息提交(submitting)到nimbus服务器上。一旦nimbus接收到了topology的压缩包,会将...
    文章 2017-07-03 1679浏览量
  • 【剖析|SOFARPC 框架】之SOFARPC 单机故障剔除剖析

    SOFARPC 单机故障剔除模块是 FaultToleranceModule,通过 SOFARPC 的 SPI 机制完成模块的自动化加载,以完成该功能的插入。FaultToleranceModule 模块包含了两个重要部分: subscriber 事件订阅器。通过订阅事件总线...
    文章 2018-11-02 1094浏览量
  • 【剖析|SOFARPC 框架】系列之 SOFARPC 单机故障剔除...

    SOFARPC 单机故障剔除模块是 FaultToleranceModule,通过 SOFARPC 的 SPI 机制完成模块的自动化加载,以完成该功能的插入。FaultToleranceModule 模块包含了两个重要部分: subscriber 事件订阅器。通过订阅事件总线...
    文章 2019-08-03 388浏览量
  • Raft共识插件详解【Hyperledger Fabric】

    Raft只能处理非拜占庭故障,也就是说Raft共识可以容忍系统崩溃、网络中断/延迟/包丢失等故障常见的支持非拜占庭故障的共识算法或系统包括:Raft、Kafka、Paxos和Zookeeper。那么,Hyperledger Fabric为什么不使用...
    文章 2019-12-05 2172浏览量
  • 一文了解 Apache Flink 核心技术

    在 Flink 1.0.0 时期,Table API(结构化数据处理API)和 CEP(复杂事件处理API)这两个框架被首次加入到仓库中。Table API 是一种结构化的高级 API,支持 Java 语言和 Scala 语言,类似于 Spark 的 DataFrame API。...
    文章 2019-04-29 1788浏览量
  • 带你读《微服务架构设计模式》之三:微服务架构中的...

    我将介绍如何通过正确处理局部故障来提高服务的可用性,并解释为什么使用远程过程调用的基于微服务的应用程序必须使用服务发现机制。我们先来看看REST。3.2.1 使用REST 如今开发者非常喜欢使用RESTful风格来开发API...
    文章 2019-11-04 7691浏览量
  • 云原生高可用技术体系构建

    (二)企业引入故障演练遇到的常见问题 在企业进行故障演练的时候,经常会遇到一些问题,比如如何设计组织架构?如何选择技术方案?如何落地演练实践?更多的问题见下图。在解决这些问题的时候,我们需要注意一个...
    文章 2020-06-18 542浏览量
  • 阿里毕玄:提升代码能力的4段经历

    多隆教会了我很多细节的问题,基于NIO的通信框架的核心是用非常少的IO线程来处理IO事件(太多也没用,因为有些部分就只能串行),所以如何高效的使用好这几个IO线程是非常关键的,要尽量减少这几个IO线程处理一些不...
    文章 2021-01-29 7996浏览量
  • 带你读《企业数据湖》之二:数据湖概念概览

    该层必须支持多线程及多事件处理。该层必须能够快速地将所摄取数据的结构转换为目标数据格式,这是Lambda架构处理层所要求的。该层必须确保所交付的所有数据都以最纯粹的形式供下一步处理。2.6.2 批处理层——批量...
    文章 2019-10-19 1347浏览量
  • Spring Cloud集成项目简介

    熔断器,容错管理工具,旨在通过熔断机制控制服务和第三方库的节点,从而对延迟和故障提供更强大的容错能力。Zuul Zuul 是在云平台上提供动态路由,监控,弹性,安全等边缘服务的框架。Zuul 相当于是设备和 Netflix 流...
    文章 2021-01-06 239浏览量
  • 怎么提升写代码的能力

    IO 事件(太多也没用,因为有些部分就只能串行),所以怎么高效的使用好这几个 IO 线程是非常关键的,要尽量减少这几个 IO 线程处理一些不相关的动作,另外一点就是尽量减少 IO 线程和业务处理线程的切换,例如后来...
    文章 2021-01-18 3612浏览量
  • 分布式系统架构技术分析(一)

    事件处理:分布式缓存提供了针对事件流的连续查询(continuous query)处理技术,满足实时性需求;极限事务处理:分布式缓存为事务型应用提供高吞吐率、低延时的解决方案,支持高并发事务请求处理,多应用于铁路、金融...
    文章 2019-08-03 1219浏览量
  • 《Storm企业级应用:实战、运维和调优》——1.1 什么...

    StreamBase认为HA问题应该通过CEP方式处理,也就是说出现问题的部件肯定会反映在System Container和HA Container的输出流上面,Monitor如果通过复杂事件处理这些Tuples就能够检测到机器故障等问题,并做出相应处理。...
    文章 2017-07-03 2266浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    通过对阿里巴巴历年故障的仔细梳理,阿里巴巴集团内的核心业务的常见故障(非业务自身逻辑问题)都可以通过流量、时延、错误等 3 类指标反应出来,我们称之为黄金指标:流量:业务流量跌零 OR 不正常大幅度上涨下跌...
    文章 2021-07-06 240浏览量
  • 如何有效可靠地管理大规模 Kubernetes 集群?

    这一设计参考控制理论中常见的负反馈闭环控制系统,系统实现闭环,可以有效抵御系统外部的干扰,在我们的场景下,干扰对应于节点软硬件故障。架构设计 如上图,元集群是一个高可用的 Kubernetes 集群,用于管理 N 个...
    文章 2019-08-15 873浏览量
  • 云上数据库容灾解决方案

    容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。目前常见的容灾方案基本上模式比较简单: 1、数据库冷...
    文章 2018-02-24 13166浏览量
  • 云上数据库容灾解决方案

    容灾技术是系统的高可用性技术的一个组成部分,容灾系统更加强调处理外界环境对系统的影响,特别是灾难性事件对整个IT节点的影响,提供节点级别的系统恢复功能。目前常见的容灾方案基本上模式比较简单: 1、数据库冷...
    文章 2018-10-15 1622浏览量
1 2 3 4 ... 16 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化