• 极速同步如何保证反向同步数据一致

    同时每个开启极速同步的共享会发送心跳包到消息主题,如果没有收到心跳包,有可能是消息主题/消息队列不可访问导致消息通路中断或者是网关宕机很长一段时间才恢复。MNS可以保证已经成功投递的消息至少会被消费一次...
    文章 2020-01-17 767浏览量
  • 公有云账单:忽略这四项成本,后果很严重!

    中断发生,并由中断导致的宕机,将导致云用户的收入受损。这些故障也可能对企业的声誉产生不利影响,即使问题已经解决了几个星期或几个月。尽管公额云成本评估工具在中断时没有订单项,但可以根据工作负载的运营成本...
    文章 2017-07-03 1109浏览量
  • 公有云账单:忽略这四项成本,后果很严重!

    中断发生,并由中断导致的宕机,将导致云用户的收入受损。这些故障也可能对企业的声誉产生不利影响,即使问题已经解决了几个星期或几个月。尽管公额云成本评估工具在中断时没有订单项,但可以根据工作负载的运营成本...
    文章 2017-08-02 969浏览量
  • 公有云账单:忽略这四项成本,后果很严重!

    中断发生,并由中断导致的宕机,将导致云用户的收入受损。这些故障也可能对企业的声誉产生不利影响,即使问题已经解决了几个星期或几个月。尽管公额云成本评估工具在中断时没有订单项,但可以根据工作负载的运营成本...
    文章 2017-10-02 927浏览量
  • 阿里云服务器发布最新的服务等级协议SLA 为全球最高...

    (6)本地盘出现宕机数据会被擦除,依赖本地盘及本地盘中数据作为启动依赖项而导致的不可用;(7)由于客户所安装软件或者其他非阿里云直接运营的第三方软件或者配置引起的ECS实例出现错误;(8)由于客户违反《云...
    文章 2019-12-17 2114浏览量
  • 阿里云服务器发布最新的服务等级协议SLA 为全球最高...

    (6)本地盘出现宕机数据会被擦除,依赖本地盘及本地盘中数据作为启动依赖项而导致的不可用;(7)由于客户所安装软件或者其他非阿里云直接运营的第三方软件或者配置引起的ECS实例出现错误;(8)由于客户违反《云...
    文章 2019-12-19 831浏览量
  • 关于Redis的几件小事|高并发和高可用

    (1)redis采用异步方式复制数据到slave节点,不过redis2.8开始,slave node会周期性地确认自己每次复制的数量。(2)一个master node 可以配置多个 salve node。(3)slave node也可以连接其他的slave node。(4)...
    文章 2019-07-23 973浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-24 3449浏览量
  • 阿里如何做到百万量级硬件故障自愈?

    对于宕机的机器而言,无法进无盘(ramos)才开【无故宕机】维修工单,这样能够大量地减少误报,减少服务台同学负担。无盘中的压测可以完全消除当前版本的kernel或软件的影响,真实地判断出硬件是否存在性能问题。b....
    文章 2018-11-19 2971浏览量
  • 云计算蓬勃发展 CIO坦言对云安全无信心

    一位不愿透露姓名的CIO谈了他的观点,现有系统迁移到云计算上,其迁移成本、实施周期、技术成熟度和安全,都是必须解决的问题。同时,他还担心花费大量预算和精力部署的云计算只是昙花一现,又被其他新技术替代。...
    文章 2017-09-28 1293浏览量
  • GitLab删库300G事故敲响警钟:如何寻求专业的数据保护...

    例如,恶意的程序破坏、文件损毁、人为误删误改、操作系统宕机、硬件故障,甚至整个机房毁于意外,在飞康CDP的全面保护下,都能最大程度地保证企业数据损失(RPO)降到最低,业务中断时间(RTO)最短。最后,一体化的...
    文章 2017-07-04 2045浏览量
  • 云计算虽蓬勃发展 云安全却令人不安

    一位不愿透露姓名的CIO谈了他的观点,现有系统迁移到云计算上,其迁移成本、实施周期、技术成熟度和安全,都是必须解决的问题。同时,他还担心花费大量预算和精力部署的云计算只是昙花一现,又被其他新技术替代。...
    文章 2017-09-28 1317浏览量
  • 把大型和云计算联系在一起 没毛病!

    说简单点,用户的核心应用会一直存在,除非其它平台能够完全取代大型机的作用,否则大型机就会一直存在下去。而相关调查显示,80%的用户认为大型机会是他们云计算架构的核心部分。这一切都证明:大型机不仅活得很好...
    文章 2017-07-03 1315浏览量
  • 把大型和云计算联系在一起 没毛病!

    说简单点,用户的核心应用会一直存在,除非其它平台能够完全取代大型机的作用,否则大型机就会一直存在下去。而相关调查显示,80%的用户认为大型机会是他们云计算架构的核心部分。这一切都证明:大型机不仅活得很好...
    文章 2017-09-01 1500浏览量
  • 蚂蚁智能监控

    因此,监控对自身的稳定要求更加严苛,在诸如大规模宕机、机房网络中断或更极端情况下,监控也需要保障自身是可以稳定运行的。针对蚂蚁智能监控自身的稳定建设,我们主要从两方面进行推进,包括稳定架构的设计...
    文章 2021-09-07 67浏览量
  • 大促场景系统稳定保障实践经验总结

    江煵在分享中提到,今年我们在新闻里听到了很多比较大的宕机事件,宕机的原因其实都很典型,删库跑路、被攻击、没有做好容量规划或者弹性能力不足、系统更改等。宕机后果还是比较严重,比如某SaaS服务商直接经济损失...
    文章 2020-11-12 7141浏览量
  • 如何管理一台集群的虚拟

    而通过隔离每台虚拟机中的应用程序,一个不安全事故或组件出现故障失败进而影响其他业务的风险得以降低,需要修补的组件数量得到减少,进一步减少了系统宕机和重新启动的次数。因为克隆虚拟机或从模板部署虚拟机很...
    文章 2017-07-04 2327浏览量
  • 阿里云RPA(机器人流程自动化)干货系列之一:认识RPA...

    异常处理机制的不健全目前国内外RPA厂商提供的软件在应用执行过程中的异常处理机制都不太健全,宕机、流程回滚、中断后的流程接续等问题目前没有一个较好的处理办法,在某些有特殊要求的流程中异常处理机制的不健全...
    文章 2019-03-12 15401浏览量
  • 计算产品和技术3.2虚拟云服务器(san三)

    由于问题的复杂及一些历史原因&xff0c;很难形成统一的云服务器应用软件的标准和规范。即使是 Linux 发行版&xff0c;操作系统应用软件生态也因为发行版基础运行环境的差异&xff0c;产生了不同程度的碎片化的事实标准。...
    文章 2021-10-13 28浏览量
  • 干货篇|阿里云RPA如何帮助创业型公司解决企业内耗(上...

    异常处理机制的不健全目前国内外RPA厂商提供的软件在应用执行过程中的异常处理机制都不太健全,宕机、流程回滚、中断后的流程接续等问题目前没有一个较好的处理办法,在某些有特殊要求的流程中异常处理机制的不健全...
    文章 2020-04-24 4470浏览量
  • 甩掉运维黑锅,容灾部署如何破?

    5.网络监控周期性将监控结果反馈给云解析DNS;6.用户向华北电信dns发起www.example.com DNS查询请求;7.华北电信dns收到用户的查询后如果没有缓存该域名,则向云解析DNS发起域名查询;8.云解析DNS收到华北电信的DNS...
    文章 2017-04-19 11898浏览量
  • 评估数据中心改造配电系统

    运维人员为此不断面临各种高难度的挑战,一方面要尽量减少各种运营支出,尽可能缩短设备宕机时间,一方面还要提高系统安全稳定以及自身操作设备人身安全。一旦电力分配系统的情况被记录下来,就需对系统中需改造的...
    文章 2017-07-04 1343浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2797浏览量
  • 饿了么交付中心语言栈转型总结

    周期性压测。3.多层次持续监控 部署机器,缓存集群,消息队列,数据库表等基础资源的基准监控。业务曲线成功率,日同比,周同比,曲线波动比,及主要接口入口流量到下游出口流量转换率监控,业务系统成熟后还应对...
    文章 2019-11-08 2477浏览量
  • 开源AIOps数据中台搭建

    SLA表示客户与服务商之间服务可用的承诺,一般以服务可用用时长为维度,例如99.99%可用,表示一个周期(例如一个月)宕机的总体时间不超过0.01%*365天<4.5分钟。有时也表示API错误率占比。IT运维挑战 但是IT...
    文章 2019-12-31 6934浏览量
  • 八年磨一剑,阿里云ApsaraDB for HBase2.0正式上线

    在旧版HBase运行的时候,当一台机器宕机的时候,这个机器所负责的region主要需要经历3个的处理流程才能恢复读——发现宕机、重新分配此机器负责的region、上线region恢复。其中发现宕机可能就需要几十秒,依赖于...
    文章 2018-06-05 10435浏览量
  • 企业运营对 DevOps 的“傲慢与偏见”

    一旦出现性能问题、宕机或故障,运维团队无疑是第一道防线,但有时问题升级会返回到应用组去修复 bug 或者帮助诊断问题。对 DevOps 感兴趣的企业往往实践或采用了一个对运维需求非常高的敏捷技术,比如建立一个测试...
    文章 2017-08-02 1187浏览量
  • Redis经典面试题总结

    Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复。主机宕机宕机前有部分数据未能及时同步到从机,切换IP后还会引入数据不一致的问题...
    文章 2020-09-26 4907浏览量
  • 华为架构师8年经验谈:从单体架构到微服务的服务化...

    治理服务的可靠由分布式服务框架自身来保证,治理服务宕机或者异常,不影响业务的正常使用。服务治理服务通常并不随服务框架发布,治理服务是可选的插件,单独随服务治理框架交付。服务化实践-高可靠 关键技术点...
    文章 2017-05-02 2626浏览量
  • DockOne微信分享(一三六):Kubernetes健康检查策略

    Q:请问,如果一个deployment有三个副本,分别部署再三个Node上,当其中一个Node宕机了,这时候对应的service中的endpoint更新需要一定的时间,用户在这个时间段访问就会有1/3的错误可能,这种情况怎么办?...
    文章 2017-10-11 818浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化