• Apache Flink 在快手的过去、现在和未来

    如果出现了一个节点故障,比如 node3 发生故障了。Flink 引擎会重新从 YARN 申请资源,完成 TaskManager 初始化,并重新部署作业。我们对一个业务作业做了一个分析,发现宕机故障后到作业恢复,共需要 90s 的时间。...
    文章 2021-02-26 987浏览量
  • 车联网上云最佳实践(二)

    数据流介绍 数据采集: 首先通过车载智能终端设备收集汽车相关行驶数据,然后通过物联网卡(即sim卡)上报到平台,平台经过协议解析服务将数据转换成可读的数据并进行存储下来,并且需要把原始数据也保存一份。数据...
    文章 2018-08-22 2538浏览量
  • 2017QCon分享:从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-10-25 2927浏览量
  • 纯干货|从淘宝到云端的高可用架构演进

    这个给我们带来的启示是什么,云服务本身也是会发生故障的,比如买了云数据库,我们没有办法假设它是100%可用的,当它出现问题我们怎么办,是给云厂商提工单说什么时候能恢复,还是我自己能够有一个容灾的方案解决这...
    文章 2017-06-19 2088浏览量
  • DAS 解决延时突高的案例分享

    去年公司有一个使用了 DAS 的对接外部系统的应用,应用开发人员反映系统会时不时地发生数据库慢查询。我们通过日志系统发现这些慢查询发生的比率极低,甚至低于千分之一。如果这是个普通的应用,低于千分之一的慢...
    文章 2020-03-27 581浏览量
  • 车联网上云最佳实践(一)

    1.1 数据流介绍 数据采集:首先通过车载智能终端设备收集汽车相关行驶数据,然后通过物联网卡(即sim卡)上报到平台,平台经过协议解析服务将数据转换成可读的数据并进行存储下来,并且需要把原始数据也保存一份。...
    文章 2018-08-31 2896浏览量
  • 疫情期,APP 崩了怎么办?阿里工程师公开高可用架构...

    已经服务于阿里全生态并开始服务外部的企业客户,解决方案为企业提供的包括营销活动支撑、整体成本控制(全链路压测、容量规划、流量控制、调度)、应急应对能力(开关和预案)、容灾逃逸能力(架构感知、故障演练、...
    文章 2020-02-18 4764浏览量
  • 数据虚拟化:商务智能系统的数据架构与管理》一 2.9...

    在一开始,用户对简单的可以让发生的事情一目了然的表格报告很满意,这之后的用户希望提供更生动的数据。接下来,用户想拥有更多的动态能力:他们想与报告中数据有所互动,并且他们想能够做到所谓的下拉和上滚窗口。...
    文章 2017-09-08 770浏览量
  • 2.0解析系列|一文详解新一代OceanBase云平台

    不同于集团内部有DBA团队承担所有数据库运维操作,外部往往按照组织结构或业务部门来划分数据库实例,各司其职,因此OCP 2.0划分了系统管理员、应用管理员、应用开发人员三个角色,每个角色有各自的用户视角,每个...
    文章 2018-10-10 1708浏览量
  • 高德服务单元化方案和架构实践

    发生单元故障进行切时,主要分为四步骤 打开单元禁写(跨单元写不敏感业务可以不配置) 检查业务延时 切换预案 解除单元禁写 PS:更新路由表时,也需要上述操作,只是第3步的切换预案变成切换新版本路由表;单元禁...
    文章 2019-11-25 7761浏览量
  • 一文读懂大数据计算框架与平台

    而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多。举一个简单的例子,...
    文章 2017-05-02 2763浏览量
  • 【独家】一文读懂大数据计算框架与平台

    而在分布式环境中进行大数据处理,除了与存储系统打交道外,还涉及计算任务的分工,计算负荷的分配,计算机之间的数据迁移等工作,并且要考虑计算机或网络发生故障时的数据安全,情况要复杂得多。举一个简单的例子,...
    文章 2017-05-01 1565浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    数据化运营:主要是将稳定性的指标量化,比如工单解决时间、工单数、报警数、报警响应时间、故障风险数、代码CR量,变更灰度时长等,通过量化指标,驱动团队同学建立量化意识,并且能给老板一份量化数据。...
    文章 2020-10-26 3284浏览量
  • 2.0 解析系列|一文详解新一代OceanBase云平台

    不同于集团内部有DBA团队承担所有数据库运维操作,外部往往按照组织结构或业务部门来划分数据库实例,各司其职,因此OCP 2.0划分了系统管理员、应用管理员、应用开发人员三个角色,每个角色有各自的用户视角,每个...
    文章 2018-10-10 2406浏览量
  • 用SpringCloud进行微服务架构演进

    大数据操作组件,它是Spring XD的替代品,也是一个混合计算模型,可以通过命令行的方式操作数据流 Spring Cloud Task 组件基于Spring Tsak,提供任务调度和任务管理的功能 以上只介绍经常用到非常重要的内容,一般的...
    文章 2019-03-25 3324浏览量
  • 《架构真经:互联网技术架构的设计原则(原书第2版)...

    此外,该公司重视由多租户模式所带来的成本效益,尽管他们沿着客户边界创建故障隔离区,但是他们仍然为不需要完全隔离的较小客户设计解决方案,使这些客户可以在数据管理系统(DBMS)内利用多租户系统。最后,该公司...
    文章 2017-05-02 1359浏览量
  • RabbitMQ实战(三)-高级特性

    但是有人可能会说,万一Con,ProRedis命令执行失败了怎么办,虽然又出现重复消费又出现Redis非正常执行命令的可能性极低,但是万一呢?OK,我们可以在Redis命令执行失败时,将消息落库,每日用定时器,对这种极特殊...
    文章 2019-07-01 1767浏览量
  • 分布式事务一致性"看这一篇就够了

    如果错误的原因是一些罕见的异常,比如因为网络传输过程出现数据丢失或者错误,应该立即再次重试,因为类似的错误一般很少会再次发生。如果错误的原因是系统繁忙(比如http协议返回的500或者另外约定的返回码)或者...
    文章 2018-04-17 10466浏览量
  • 【双11背后的技术】万亿交易量级下的秒级监控

    阿里全球运行指挥中心(GOC)基于历史监控数据,通过异常检测、异常标注、挖掘训练、机器学习、故障模拟等方式,进行业务故障的自动化定位,并赋能监控中心7*24小时专业监控值班人员,使阿里集团具备第一时间发现...
    文章 2017-01-12 5374浏览量
  • 微服务架构下的事务一致性保证

    如果错误的原因是一些罕见的异常,比如因为网络传输过程出现数据丢失或者错误,应该立即再次重试,因为类似的错误一般很少会再次发生。如果错误的原因是系统繁忙(比如http协议返回的500或者另外约定的返回码)或者...
    文章 2016-12-09 17787浏览量
  • Kubernetes Operator深入详解

    DevOps 团队可能会通过这种方式来管理数据库或其他外部产品。难点不在于 Operator 本身,而是要学会理解它的行为。多年来,Operator 一直是 Kubernetes 生态系统的重要组成部分。通过将管理界面移动到 Kubneretes ...
    文章 2020-12-24 376浏览量
  • 企业安全管理的“六脉神剑”

    发布日志数据外部服务器有助于保护日志数据。如果服务器被攻破,攻击者也无法修改本地日志和掩盖他们的踪迹。日志整合到一个中央源,使数据更易于管理,因为查询只需要对一个批次的数据运行处理。Unix的系统日志...
    文章 2017-05-02 1189浏览量
  • 游戏云间之一:弹性扩展

    确保业务连续性,在某一个或者几个服务器发生故障时,请求只会被转发至健康的服务器,这一点也可以用来避免game服务器的单点失败或者实现灾备功能。那么负载均衡要怎么实现呢,可以利用开源软件自行实现,如果是使用...
    文章 2016-11-17 1577浏览量
  • [原创]游戏云间之一:弹性扩展

    确保业务连续性,在某一个或者几个服务器发生故障时,请求只会被转发至健康的服务器,这一点也可以用来避免game服务器的单点失败或者实现灾备功能。那么负载均衡要怎么实现呢,可以利用开源软件自行实现,如果是使用...
    文章 2016-01-18 1919浏览量
  • 【智驾深谈】特斯拉死亡事故官方洗白,业界被判死缓...

    3)与发生事故的特斯拉Autopilot 和AEB 系统相关的数据;4)特斯拉在 Autopilot 和 AEB 系统中进行的改变。2.0 AEB 系统 2.1 AEB 技术 自动紧急制动包括以下避免碰撞的技术:前方碰撞警告(FCW),动态制动器支持...
    文章 2017-08-01 1065浏览量
  • [QCon讲稿实录]谈高质量架构产品化输出

    尤其是去年发生了多起IDC故障,用户对高可靠系统架构的需求格外高。所以针对这种情况,我们又推出了EWS服务,目的让用户能够简单的获取高质量架构的能力。首先来看一下EWS 的业务架构,EWS的全称是Enterprise ...
    文章 2016-04-25 5063浏览量
  • 带你读《物联网之魂:物联网协议与物联网操作系统》之...

    (2)需求2 现在能通过电线发数据流了,但是还希望通过无线电波或其他介质来传输,而且还要保证传输过去的比特流是正确的,要有纠错功能。于是,科学家们又提出了数据链路层的概念:通过各种控制协议,将有差错的...
    文章 2019-11-12 837浏览量
  • 微服务与配置中心:别让您的微服务被配置管理“绊”了...

    在生产上可能有几台机器坏了或者甚至一个机房坏了,出问题了,出故障了那基础设置(infrastructure)这一块呢,可能有一些事件冒泡到软件平台PaaS这一层,这个时间冒泡一般会到DBA团队的一些数据库高可用基础设施,...
    文章 2018-02-12 7050浏览量
  • 带你读《Python网络编程(原书第2版)》之三:API和...

    当网站需要成为另一台计算机的Web服务时会发生什么?相同的Web资源需要适应人类客户和其他计算机程序。这个问题听起来不像我们之前介绍过的吗?答案就是应用程序接口(API)。值得注意的是,根据维基百科,API是一个...
    文章 2019-11-14 873浏览量
  • 宜信微服务任务调度平台建设实践

    任务可由定时时间(Cron 表达式)或外部请求(提供 API 地址)开始,根据 DAG 逻辑执行。元数据管理。微服务中各个任务元数据的管理同步数据抓取、录入。智能运维。可视化的任务实时监控,所有监控都是有页面可以看到...
    文章 2019-10-22 1780浏览量
1 2 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化