• GitHub网站究竟可不可靠?谷歌工程师教你用BigQuery一...

    尽管上面的分析还未得出任何结论,但是我们可以先将阈值设为每分钟20个事件,并以此为服务是否"宕机"判断依据,看看我们能够发现什么。使用下面的查询语句我们可以看到GitHub在2016年7月总共宕机了多少分钟: ...
    文章 2017-02-11 5788浏览量
  • MySQL-高可用性:少宕机即高可用?

    宕机事件表现形式 占比 导致宕机的原因运行环境 35%磁盘空间耗尽性能问题 35%1.低性能 SQL;2.服务器 BUG;3.糟糕的表结构设计和索引设计复制 20%主备数据不一致数据丢失或损坏 10%误操作删除数据,缺少备份运行环境...
    文章 2019-04-29 1087浏览量
  • 黑客与宕机

    对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack is corrupted in:ffffxxxxxxxx87eb",如图 2 所示。图2 关于这条信息,我们必须逐字解读。Kernel panic-not syncing:...
    文章 2020-07-17 780浏览量
  • MongoDB trouble shoot sharded clusters

    但是,应用程序必须能够处理部分结果,此时DBA该调查中断的原因,并尝试尽快恢复分片。Part4:configserver副本集成员不可用 在版本3.2中更改:从MongoDB 3.2开始,分片集群的配置服务器可以部署为副本集。副本集配置...
    文章 2017-11-08 1423浏览量
  • 从Cloudflare事件看DNS服务的重要性

    随后,Cloudflare博客中更新了此次中断的原因:在处理与纽瓦克到芝加哥的网络阻塞问题时,其网络工程团队更新了亚特兰大路由器上的配置。然而,此配置包含了一个错误,该错误直接导致跨越Cloudflare主干网络的所有...
    文章 2020-08-26 747浏览量
  • 一行小错为何产生巨大破坏-Facebook史诗级故障大反思

    恰恰是这条简单的指令,造成的影响却是史诗级别的,本次宕机事故非常彻底,甚至Facebook自己的内网也完全报废,无法访问。笔者看到事件解决过程中不少运维方面的大牛都直接把故障的原因定位到了DNS和BGP方面。​从...
    文章 2021-10-07 135浏览量
  • 关于Redis的几件小事|高并发和高可用

    有了min-slaves-max-lag这个配置,就可以确保说,一旦slave复制数据和ack延时太长,就认为可能master宕机后损失的数据太多了,那么就拒绝写请求,这样可以把master宕机时由于部分数据未同步到slave导致的数据丢失...
    文章 2019-07-23 973浏览量
  • 实用技巧:如何用负载均衡构建高可用服务?

    当单台服务器已经无法处理访问请求时,当我们的服务宕机时,当有人试图攻击我们的服务时,我们应该怎么办?升级后端服务时,怎样才能不中断服务?如何构建一个高可用的服务?连接级 服务器级 可用区级 Region级 健康...
    文章 2016-07-05 4819浏览量
  • 天梭M13为何具有大型水平的高可用性

    SFDP对于不同层次、不同部件执行的检测强度是不同的,对内存等核心部件检测强度最高,因为内存错误和内存故障是引起系统停机的主要原因之一,目前通用服务器的内存错误主要依靠ECC内存技术来处理(Error Checking ...
    文章 2017-08-02 1442浏览量
  • 实用技巧:如何用负载均衡构建高可用服务?

    当单台服务器已经无法处理访问请求时,当我们的服务宕机时,当有人试图攻击我们的服务时,我们应该怎么办?升级后端服务时,怎样才能不中断服务?如何构建一个高可用的服务?连接级 服务器级 可用区级 Region级 健康...
    文章 2017-12-03 1442浏览量
  • 10款常见MySQL高可用方案选型解读

    并且多节点同时宕机的几率也要小于单节点宕机的几率,所以多节点架构在一定程度上可以认为高可用性是好于双节点架构。但由于数据库数量较多,所以需要数据库管理软件来保证数据库的可维护性。可以选择MMM、MHA或者...
    文章 2017-05-16 5845浏览量
  • MySQL数据库的几种常见高可用方案

    并且多节点同时宕机的几率也要小于单节点宕机的几率,所以多节点架构在一定程度上可以认为高可用性是好于双节点架构。但是由于数据库数量较多,所以需要数据库管理软件来保证数据库的可维护性。可以选择MMM、MHA或者...
    文章 2017-04-25 12748浏览量
  • 计算产品和技术3.2虚拟云服务器(san三)

    使得虚拟机的性能逼近物理机的性能&xff0c;是虚拟机技术发展的主要趋势。好的性能不单单要靠高性能的虚拟机&xff0c;也要靠高性能的 Guest OS。云服务提供商之间的性能竞争正在成为全栈的竞争&xff0c;而保持Guest OS 高...
    文章 2021-10-13 22浏览量
  • 阿里云RPA(机器人流程自动化)干货系列之一:认识RPA...

    异常处理机制的不健全目前国内外RPA厂商提供的软件在应用执行过程中的异常处理机制都不太健全,宕机、流程回滚、中断后的流程接续等问题目前没有一个较好的处理办法,在某些有特殊要求的流程中异常处理机制的不健全...
    文章 2019-03-12 15229浏览量
  • springcloud微服务四:服务容错保护Hystrix断路器

    当然了,我这里演示的时候,为了方便都是直接关掉了其中一台服务器,这相当于实际生产中的服务器突然宕机或者进程突然中断的情况,而实际上这种情况发生的几率还是比较少的。由于在分布式高可用的系统中,一般不同的...
    文章 2017-09-12 2005浏览量
  • 高并发服务端分布式系统设计概要(上)

    Group Master和Group Slave可以共享同一个File System(用于不能丢数据的强一致性系统),也可以分别指向不同的File System(用于弱一致性,允许停写服务和系统宕机时丢数据的系统),但总之应认为这个”File System...
    文章 2017-02-09 1429浏览量
  • 干货篇|阿里云RPA如何帮助创业型公司解决企业内耗(上...

    异常处理机制的不健全目前国内外RPA厂商提供的软件在应用执行过程中的异常处理机制都不太健全,宕机、流程回滚、中断后的流程接续等问题目前没有一个较好的处理办法,在某些有特殊要求的流程中异常处理机制的不健全...
    文章 2020-04-24 4282浏览量
  • 阿里云容器服务测评

    经过一个月的测试、迁移和开发,我们已将测试环境所有服务迁移到容器服务,并针对容器服务的问题,做了很多workaround,最终在容器服务上搭建了一个高可用零宕机的容器环境。下面我们从《云计算十字真言及其在小博...
    文章 2017-03-03 5150浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2786浏览量
  • 2017,那些我们一起删库跑路的日子

    而最终,还是败在了存储,数据写入失败直接导致数据库宕机。别这么看我,我们都犯错,只是我犯的错误更严重罢了 2017-04-05,位于纽约的云服务商 Digital Ocean 遭遇了一次长达4小时56分钟的停机事故,事故的原因是...
    文章 2017-07-17 3235浏览量
  • MySQL 复制-性能与扩展性的基石 3:常见问题及解决...

    mysql5.5 考虑到 slave 宕机中继日志损坏这一问题,只要在 slave 的的配置文件 my.cnf 里增加一个参数 relay_log_recovery=1 即可。1.5 二进制日志与 InnoDB 事务日志不同步由于各种各样的原因,MySQL 的复制碰到...
    文章 2019-04-08 1059浏览量
  • 企业级自动化运维工具方案设计

    自动化运维是基于流程化的框架,将事件与IT流程相关联,一旦被监控系统发现性能超标,超过预先配置的阀值或宕机,就会触发相关事件以及事先定义好的流程,可自动启动故障响应和恢复机制。自动化工作平台还可帮助运维...
    文章 2019-12-13 1995浏览量
  • 传统保险企业基于 Dubbo 的微服务实践

    目前,中国人寿海外的 Dubbo 每天调用次数超过2100万次,从上线到现在,还没有出现过宕机的情况。Dubbo的配置结构 这里再分享一下我们所用的配置,需要强调的两点是,一是重试的机制,即服务中断的时候利用控制平台...
    文章 2019-08-06 5426浏览量
  • 《策略驱动型数据中心——ACI技术详解》一第1章 数据...

    更高的存储可用性:在传统环境中,维护、存储升级、断电、病毒等所导致的计划内或计划外宕机,会导致最终用户的应用中断。借助存储虚拟化和冗余,可快速配置新存储资源,减少了宕机所造成的影响。改善的存储性能:...
    文章 2017-05-02 2393浏览量
  • 《策略驱动型数据中心——ACI技术详解》——第1章 ...

    更高的存储可用性:在传统环境中,维护、存储升级、断电、病毒等所导致的计划内或计划外宕机,会导致最终用户的应用中断。借助存储虚拟化和冗余,可快速配置新存储资源,减少了宕机所造成的影响。改善的存储性能:...
    文章 2017-05-02 2036浏览量
  • Oracle数据库备份恢复的概念:错误类型、实例恢复方法...

    5.实例错误:比如数据库突然宕机;6.媒体错误:比如因为磁盘损坏或者OS级别删除而丢失了数据库文件;Statement Failure 1.试图往表中插入非法数据:需要程序前端做验证,或者让用户修改数据;2.尝试执行某个操作时权限不足:...
    文章 2017-05-02 1594浏览量
  • 解决mysql使用GTID主从复制错误问题

    做MySQL主从的话肯定会遇到很多同步上的问题,大多数都是由于机器宕机,重启,或者是主键冲突等引起的从服务器停止工作,这里专门收集类似问题并提供整理解决方案,仅供参考!1、主从网络中断,或主服务器重启,或从服务器...
    文章 2016-02-24 4328浏览量
  • Redis经典面试题总结

    Redis 不具备自动容错和恢复功能,主机从机的宕机都会导致前端部分读写请求失败,需要等待机器重启或者手动切换前端的IP才能恢复。主机宕机宕机前有部分数据未能及时同步到从机,切换IP后还会引入数据不一致的问题...
    文章 2020-09-26 4449浏览量
  • 蚂蚁智能监控

    因此,监控对自身的稳定性要求更加严苛,在诸如大规模宕机、机房网络中断或更极端情况下,监控也需要保障自身是可以稳定运行的。针对蚂蚁智能监控自身的稳定性建设,我们主要从两方面进行推进,包括稳定性架构的设计...
    文章 2021-09-07 40浏览量
  • 超越批处理的世界:流计算

    同时流计算系统还必须针对系统宕机后还能保证数据一致性进行精心的设计。几年前,当Spark刚刚出现在大数据领域的时候,它几乎就是照亮了流计算黑暗面的灯塔(译者注:因为Spark支持强一致)。在这之后,情况越来越好...
    文章 2017-05-02 985浏览量
1 2 3 4 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化