• 预防宕机靠RAC,和力记易说那就OUT了

    服务器宕机的原因有很多,据不完全统计,“运行环境”是排名第一的服务器宕机类别,大约35%的时间属于这一类。运行环境可以看作是支持数据库服务器运行的系统和资源集合,包括操作系统、硬件以及网络等。性能问题...
    文章 2017-08-09 949浏览量
  • MySQL-高可用性:少宕机即高可用?

    宕机事件表现形式 占比 导致宕机的原因运行环境 35%磁盘空间耗尽性能问题 35%1.低性能 SQL;2.服务器 BUG;3.糟糕的表结构设计和索引设计复制 20%主备数据不一致数据丢失或损坏 10%误操作删除数据,缺少备份运行环境...
    文章 2019-04-29 1159浏览量
  • AWS因输入错误导致云服务中断——同类问题曾在技术...

    Amazon Web Services在经历严重的S3服务宕机之后进行了全面检查,而原因则被归结为一点:输入错误。输入错误?很多朋友一定对如此低级的肇事原因感到意外。但事实上,输入错误长久以来一直困扰着技术行业,且曾经...
    文章 2017-09-01 1221浏览量
  • 云服务频频发生宕机 谁的利益最受影响?

    2015年3月11日,Apple iCloud内部DNS错误导致其iTunes和App Store的服务宕机,一些iCloud的电子邮件帐户也受到短暂影响。2015年,5月27日晚6点时左右,杭州、北京、上海、武汉等地用户反映,支付宝无法正常使用。...
    文章 2017-07-05 1673浏览量
  • 《DevOps故障排除》笔记

    故障排除的最佳实践、服务器为什么这么慢、为什么系统无法启动、为什么磁盘无法写入、服务器宕机了、为什么主机名无法解析、为什么无法收发邮件、网站宕机了、为什么数据库这么慢、硬件问题 1、服务器为什么这么慢 ...
    文章 2018-05-07 827浏览量
  • Facebook 史上最严重宕机:互联网企业是时候重新审视...

    而这也是此次宕机事件的原因所在。Janardhan 表示,在一项日常维护工作中,工程师们发出一条用于评估全球骨干网容量可用性的指令,但意外切断了骨干网络中的所有连接,这实质上就是断开了 Facebook 全球数据中心之间...
    文章 2021-12-09 86浏览量
  • 缓存雪崩的含义及解决方案

    缓存雪崩的定义&xff1a;大量请求无法在Redis缓存中处理&xff0c;导致这些请求被发送到数据库&...而是直接返回预定义、空值或是错误信息&xff1b;针对核心数据&xff0c;仍然走缓存&xff0c;缓存找不到&xff0c;继续通过数据库读取。
    文章 2022-05-30 16浏览量
  • centos7之docker安装

    一类,java代码的问题,某个类导致线程阻塞导致内存泄露,使tomcat突然宕机和某个类找不到异常导致宕机;二类,java运行环境内存不足,通过调tomcat内存解决该问题,不过这并不能解决这个问题,当然tomcat初始内存的确...
    文章 2018-05-23 1499浏览量
  • 黑客与宕机

    分析 Linux 内存转储的第一步,我们使用 crash 工具打开内存转储,并用 sys 命令观察系统的基本信息宕机的直接原因。对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack ...
    文章 2020-07-17 1108浏览量
  • 黑客与宕机

    使用crash工具sys命令,我们可以看到系统的一些基本信息,和宕机的直接原因。对于这个问题来说,宕机的直接原因是"Kernel panic-not syncing:stack-protector:Kernel stack is corrupted in:ffffffffa02987eb。关于...
    文章 2018-05-04 2819浏览量
  • 两个数据访问受限的问题

    我没有着急把数据库先启动,而是启动到了nomount状态,尝试看看有什么信息错误的原因其实很简单,就是系统资源设置不足导致,比如memlock,可以通过启动的错误日志看出。 Starting ORACLE instance(normal) ...
    文章 2017-07-21 897浏览量
  • 将关键性业务应用迁移至云环境前,必须弄清的五个问题

    将业务分布托管在多家云服务供应商站点中能够确保客户免受单站或者单一区域宕机的影响。作为另一项建议,大家还应当监控自己的全球网络,从而检测其当前负载水平。我们需要关注性能问题,并利用现有工具进行负载均衡...
    文章 2017-07-06 1100浏览量
  • 美国连发三大电脑故障:纽交所中断交易近4小时

    该公司并未透露问题原因,但有人猜测是纽交所的宕机导致该网站的访问量大增,令服务器过载。这三次技术故障有何共同点?三家公司都依赖庞大的电脑系统。自动化软件非常复杂,有时会牵扯数百万行计算机代码,一个简单...
    文章 2017-08-01 978浏览量
  • HBase问题诊断 – RegionServer宕机

    然而,这些和我们的终极目标好像并没有太大关系,别忘了我们的目标是找到RS宕机的原因哦!破案铺垫篇 经过对案件现场的排查,唯一有用的线索就是HBase在宕机前经历了很严重、很频繁的Full GC,从下面日志可以进一步...
    文章 2017-08-01 1705浏览量
  • 从年末生产故障解锁RocketMQ集群部署的最佳实践

    是因为客户端一直尝试从已宕机的nameserver去更新路由信息&xff0c;但由于一直无法请求成功&xff0c;故客户端的缓存路由信息一直无法得到更新&xff0c;造成了上面的现象那问题来了&xff0c;按照我们对RocketMQ的认识&xff0c;...
    文章 2022-05-29 50浏览量
  • AWS S3宕机暴露Amazon规模级互联网中的致命瓶颈

    S3宕机事件发生于2月28日上午9:44(太平洋时间),当时其位于北弗吉尼亚州的热门数据中心(美国东一服务区)存储桶发生访问问题并导致错误率上升。对于众多用户而言,其数据在此阶段遭遇无法访问故障,且在持续五个...
    文章 2017-09-01 1745浏览量
  • 热备方案及双热备软件选择

    如果运行着关键业务信息系统的服务器发生宕机或是因为不可控的原因而停止,从而导致整个企事业机构的信息运营系统瘫痪,将会给企事业机构带来巨大的经济损失,而由于企事业机构的业务不能正常运行也会影响企事业机构...
    文章 2017-08-09 4553浏览量
  • CIO必须知道的关于数据中心宕机的10个问题

    以下就是首席信息官必须知道的关于数据中心宕机的10个问题: 1、假设数据中心明天要宕机,你会怎么做?这是一个价值上百万美元的问题,大概很多首席信息官都回答不上来,但是,如果事前不知道数据中心存在的漏洞和...
    文章 2018-03-08 1158浏览量
  • 分库分表中间件的高可用实践

    而重启的时间也会导致不可用,与物理机宕机的情况相比是其不可用的时间点是可知的,重启的动作也是可控的,那么我们就可以利用这些信息去做到流量的平滑无损。让client端感知即将下线 在笔者所知的很多做法中,让...
    文章 2019-05-15 1930浏览量
  • 机器宕机引发的复制集心跳异常问题

    当从 node1、node2的 rs.status()看,node3却处于宕机状态,错误如下 { id":3, name":"node3:port3", health":0, state":8, stateStr":"(not reachable/healthy)", uptime":0, optime":Timestamp(0,0), ...
    文章 2016-07-22 3152浏览量
  • 路透社:美国金融公司因使用云服务省了数十亿美元

    两年前,一场类似于亚马逊上个月云服务宕机的故障可能会进一步加深美国金融公司这样的印象,即将数据和系统转移到公有云,是一件极为危险的事情。实际上,2月28日的故障并未对金融行业使用云服务带来太大影响,这...
    文章 2017-07-03 1271浏览量
  • GitHub网站究竟可不可靠?谷歌工程师教你用BigQuery一...

    尽管上面的分析还未得出任何结论,但是我们可以先将阈值设为每分钟20个事件,并以此为服务是否"宕机"判断依据,看看我们能够发现什么。使用下面的查询语句我们可以看到GitHub在2016年7月总共宕机了多少分钟: ...
    文章 2017-02-11 5932浏览量
  • 微信高可用分布式数据库PhxSQL设计与实现

    但当Master连续出现两次宕机后产生Master切换,两次宕机间隔较短使得Pending Binlog未能及时复制到Slave,且期间有查询请求时(Master宕机→Master重启→查询数据→Master宕机→Master切换),MySQL Client会产生如图5...
    文章 2017-08-02 1711浏览量
  • 性能测试loadrunner场景问题之HTTP

    如果压力很小就出现这个问题,可能是脚本某个地方有错误,要仔细查看脚本,提示的错误信息会定位某个具体问题发生的位置。解决办法:例如上面的错误现象问题定位在某个URL上,需要再次运行一下场景,同时在其他机器...
    文章 2017-11-16 1173浏览量
  • 域名解析出现错误怎么办

    而且这个域名服务器一般都是双机热备份服务器,并且保持24小时正常运行,但是一旦出现服务器宕机或者域名A记录以及主机记录等信息更改,只有等待服务器重新启动,或者服务器会自带有域名信息刷新功能,一般在一个...
    文章 2017-05-27 2333浏览量
  • Jira 等云产品宕机多日,这场 Atlassian 有史以来的...

    事件页面上的大多数状态更新都是复制粘贴相同的内容,这样做显然是为了每隔几个小时提供一次更新……但这些不是更新,他们增加了无法控制住宕机的感觉。避免沉默。直到第 9 天,Atlassian 一直处于静默状态。不惜...
    文章 2022-04-18 77浏览量
  • Facebook宕机背后,我们该如何及时发现DNS问题

    Facebook 及其旗下 Instagram 和 WhatsApp 等应用全网宕机&xff0c;停机时间将近 7 小时 5 分钟&xff0c;浏览器在尝试打开时显示 DNS 错误。这对于旗下应用群月活和日活高达 35.1 亿和 27.6 亿的 Facebook 而言&xff0c;...
    文章 2022-04-11 38浏览量
  • Facebook宕机背后,我们该如何及时发现DNS问题

    Facebook 及其旗下 Instagram 和 WhatsApp 等应用全网宕机&xff0c;停机时间将近 7 小时 5 分钟&xff0c;浏览器在尝试打开时显示 DNS 错误。这对于旗下应用群月活和日活高达 35.1 亿和 27.6 亿的 Facebook 而言&xff0c;...
    文章 2021-10-09 633浏览量
  • 高可用笔记(2)redis

    ODOWN,即objectively down,当sentinel认为mymaster主观宕机(SDOWN)时,会发起一个投票,之后当多数sentinel判断mymaster已经宕机时,才会得出结果ODOWN。那么这里判断mymaster ODOWN时就必须有两台sentinel投...
    文章 2017-01-11 2316浏览量
  • MySQL 组复制介绍

    异步复制模式下,如果 slave 全部宕机,则在 master 上的事务无法同步到 slave 上,存在一定的数据安全风险。半同步复制解决了数据安全风险的问题,在半同步环境下要求至少有一台 slave 接收到 master 的binlog并...
    文章 2017-11-22 1104浏览量
1 2 3 4 ... 29 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化