• 关于

    系统故障宕机的原因

    的搜索结果
  • Twitter 就网站宕机表示道歉:公布初步原因

    北京时间7月27日早间消息,Twitter网站周四出现宕机,Twitter表示,两处数据中心的“基础设施同时出现问题”是导致服务宕机的主要原因。 美国太平洋时间周四8:20至9:00(北京时间周四23:20至24:00),Twitter网站出现宕机,这一故障随后持续了约2小时。通 常情况下,如果一...

    文章 技术小牛人 2017-11-05 646浏览量

  • 怎样管理Lotus Domino

    一个从事3年以上Lotus Domino的维护人员才能比较娴熟的处理一些复杂的问题,除了Lotus Domino以外,对于Lotus Domino所部署的主机操作系统,也要非常精通才行,因为一些大型的Lotus Domino系统必须依赖性能很强的Unix操作系统(Solaris或AIX等)。而有时...

    文章 技术小美 2017-11-09 2011浏览量

  • 预防宕机靠RAC,和力记易说那就OUT了

       “宕机”是计算机术语,是根据英文down翻译过来的,是指系统无法从一个系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重启动系统的现象。日常生活中我们遇到的电脑“蓝屏”就是宕机的一种常见表现,此外,专业IT机房里的服务器也会因为数据库死锁、某些服务挂掉等发生宕机。 ...

    文章 boxti 2017-08-09 797浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 数据中心设计建造中的八个事实

    本文指出了数据中心设计建造中的八个事实,看看你是不是还被蒙在鼓里呢?   1.只要有功率输入,即有热量输出 在数据中心的供电系统中,绝大部分电能是要转化成热量的,只有少数电能是真正得到利用的。这是由于数据中心的供电线路存在电阻所致,除非你的数据中心采用超导体供电,否则你将永远为这些散失到空间里的热...

    文章 青衫无名 2017-09-01 934浏览量

  • 双机热备份

    统双机热备份的工作原理,是一种故障转移的方式,  1、一般来讲要求主备机安装有相同的软件或数据库,主备机必须有共享数据的磁盘阵列存储子系统,用于保证状态切换后的数据连续性。  2、主备机间存在有基于TCP/IP Socket接结方式或串口联结方式等的心跳检测链路,主备机间通过不断的通讯联系来确保检...

    文章 白展糖 2013-12-09 838浏览量

  • 666IDC高防服务器 全年24小时30秒售后回复 有问题找我

    独立经营福州,福州,福州,电信高防机房高防服务器咨询QQ:97533879 TEL:17689221416 服务器“异常”的几个可能性预警请重视!提到服务器宕机检测,大家会想到,宕机能够很快知道,这个有什么可做的?实际上,很多时候服务器宕机,并不总是被及时感知。服务器宕机,ping或者ssh这是...

    文章 游客t4xr6n5tdnato 2020-05-14 428浏览量

  • GitLab误删 300G数据的一点启示

    2017年1月31日GitLab.com发生的严重生成故障,导致宕机18小时,永久丢失6小时数据。 事后官方对故障原因作出了详细的解释,如下 误删 300G,GitLab 官方对删库事故的事后分析 这个事件,作为反例非常有借鉴意义。 通用的启示: 1. 定时检查备份的有效性。 2...

    文章 小桥河西 2017-02-15 734浏览量

  • SUN平台,光纤共享存储互斥失败导致的数据灾难恢复

    [数据恢复故障描述]   两台SPARC SOLARIS系统通过光纤交换机共享同一存储,本意是作为CLUSTER使用,但配置不当,两台SERVER并未很好地对存储互斥,设计意图为:平时A服务器正常工作,当A服务器宕掉后,关掉A,开启B接管服务。   偶然的机会,一位管理人员开启B服务器,查到B服务...

    文章 余二五 2017-11-29 762浏览量

  • OceanBase高可用实践

    背景 高可用是构建分布式系统的基石。一方面,出于成本考虑, 分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足, 而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%), 一个1000台机器规模的集群每天将面临1台机器宕机的风险,在如此大规模的情况下,存储...

    文章 KB小秘书 2019-07-28 1429浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 裴旻 2018-08-06 10481浏览量

  • 高可用系统常用解决手段浅述

    所谓可用性,是指 某系统能够提供正常服务的特性。 可用性的高低是使用不可用时间占总时间的比例来衡量。不可用时间是从故障发生到故障恢复的时间。 比如,可用性 4 个 9 的系统(99.99%),它一年宕机时间不能超过53分钟(=365*24*60*(1-0.9999)) 。 做到高可用系统,需要尽可...

    文章 知与谁同 2017-05-23 1363浏览量

  • Windows Azure HandBook (1) IaaS相关技术

      《Windows Azure Platform 系列文章目录》     1.Microsoft Azure底层是否由System Center和Hyper-V构成?   Microsoft Azure虽然支持Hyper-V的VHD直接上传至Azure云端进行管理,但是Azure底层技术是微软自...

    文章 zting科技 2017-10-04 764浏览量

  • 将关键性业务应用迁移至云环境前,必须弄清的五个问题

    面向云环境的迁移工作正如火如荼地进行。在去年的Gartner IT研讨博览会上,超过半数CIO表示将把云优先战略作为接下来的运营重心。Verizon公司在其《市场状态:2016年企业云》报告中提到,有84%的受访企业表示其云使用量在过去一年中迎来显著提升,而且有半数企业宣称其到2018年至少将把7...

    文章 泡泡浅眠 2017-07-06 809浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3341浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2729浏览量

  • 为何helpdesk的电话总是那么多

    本文出自Simmy的个人blog:西米在线 http://simmyonline.com/archives/294.html   每天我们都忙于救火,忙于帮用户处理电脑故障。按照Gartner的IT成熟度模型的标准看,我们的IT仍属于最基本的成本中心阶段,典型的特点是应对型,头痛医头;问题驱动型...

    文章 技术小美 2017-11-11 767浏览量

  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自建、混合云环境集群

    HBase可以支持百TB数据规模、数百万QPS压力下的毫秒响应,适用于大数据背景下的风控和推荐等在线场景。阿里云HBase服务了多家金融、广告、媒体类业务中的风控和推荐,持续的在高可用、低延迟、低成本方向上进行优化。目前单集群承诺可用性99.9%,SSD机型上可以做到请求毛刺99.5% < ...

    文章 daniel.meng 2019-10-11 2099浏览量

  • 飞天技术汇 | 阿里云发布ECS运维体系,提供原生运维能力

    作为运维人员你是否遇到过 大量ECS资源不知如何管理和部署? 不知ECS发生宕机或意外重启的原因? 哪些故障响应机制可保障业务连续性? 我们知道,故障几乎无法完全避免,但如果总是在故障发生时才靠运维人员来解决问题,不仅太被动,对业务连续性也有非常高威胁。 所以,“主动”运维显得尤为重要。 8月8...

    文章 阿里云头条 2018-08-13 1991浏览量

  • 使用云监控和函数计算,秒级恢复故障

    云监控发布新feature,打通事件中心和函数服务,可以实现秒级故障恢复。 试想这样一个场景: 当ecs宕机时,在几秒内实现eip自动迁移至另一个健康的ecs实例,快速故障恢复,避免损失。 如何做到? 云监控之前推出了事件中心,定位于,将阿里云上发生的对用户有影响的事件,集中起来,统一展示,统一管...

    文章 江米 2018-08-07 1597浏览量

  • 阿里云HBase推出普惠性高可用服务,独家支持用户的自建、混合云环境集群

    HBase用户福利 新用户9.9元即可使用6个月云数据库HBase,更有低至1元包年的入门规格供广大HBase爱好者学习研究,更多内容请参考链接 前言 HBase可以支持百TB数据规模、数百万QPS压力下的毫秒响应,适用于大数据背景下的风控和推荐等在线场景。阿里云HBase服务了多家金融、广告、媒...

    文章 daniel.meng 2019-10-17 4168浏览量

  • UPS系统的创新研发要契合数据中心供电架构的发展变化

    在数据中心供电架构建设中,实际应用存在的问题和不断涌现的全新需求,是UPS系统在研发设计上实现科技创新的基础和动力,同时也是检验新产品是否符合要求,有没有推广应用前景的客观标准。从另一个角度而言,就是要求UPS系统的研发要最大程度地契合数据中心供电架构的发展变化。 数据中心要素向可靠性回归 云计算...

    文章 沉默术士 2017-07-03 857浏览量

  • MongoDB高可用集群配置的几种方案

    一、高可用集群的解决方案 高可用性即HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性。 计算机系统的高可用在不同的层面上有不同的表现: (1)网络高可用 由于网络存储的快速发展,网络冗余技术被...

    文章 邴越 2016-10-11 21715浏览量

  • 黑客与宕机

    宕机问题有一种比较少见的pattern,就是看起来完全不相关的机器同时出现宕机。处理这个pattern的问题,我们需要找到,在这些机器上能同时触发问题的条件。 通常,这些机器要么几乎在同一时间点出现问题,要么从某一个时间点开始,相继出现问题。对于前一种情况,比较常见的情形是,物理机故障导致运行在其...

    文章 声东 2018-05-04 2496浏览量

  • [New Portal]Windows Azure Virtual Machine (1) 概念

    《Windows Azure Platform 系列文章目录》      前面几章我已经给大家介绍了Windows Azure PaaS的好处,总结下来有以下几点:   1.面向应用,而不是面向IT基础。微软作为云计算供应商,让用户将更多的精力放在构建优秀的软件架构;而不必去考虑底层的问题,例如网...

    文章 zting科技 2017-04-30 1048浏览量

  • 【分布式系统工程实现】CAP理论及系统一致性

    印象中CAP理论开始流行是从Amazon Dynamo的论文开始的,Amazon的CTO还在他的博客中介绍了最终一致性的概念,从此以后,各种会议和交流中都少不了CAP的影子。然而,对于分布式系统工程设计和开发来说,CAP意味着什么呢? CAP 理论由 Berkerly 的 Brewer 教授提出,...

    文章 knuthocean 2016-04-11 2363浏览量

  • 黑客与宕机

    相信凡是与计算机高频亲密接触的人,都遇到过系统无响应,或突然重启的情况。这样的情况如果发生在客户端设备,如手机,或者笔记本电脑上,且不是频繁出现,基本上我们的解法就是鸵鸟算法,即默默重启设备,然后继续使用,当作什么都没发生过。 但是,如果这样的问题发生在服务端,比如运行微信、微博后台程序的虚拟机或...

    文章 茶什i 2020-07-17 657浏览量

  • 服务器运维的日常维护工作有哪些

    一、认识服务器 良知知彼才气百战不殆,假如对本身维护的服务器都不相识,何故能正确办理服务器宕机、补丁安装,裂痕修复等问题。 1.服务器操纵系统范例,版本,补丁版本; 2.服务器硬盘利用率; 3.服务器运行业务的环境; 4.服务器网络设置环境等。 二、按期查抄 1.服务器电源状态查抄; 2.服务器电...

    文章 zhubaojie 2018-07-07 2276浏览量

  • CactiEZ10.1 不出图诡异故障排查

       在公司部署了一套CactiEZ用于实时监控多个网络设备的工作状态,设置了阈值和宕机短信报警,异常发生时系统会自动给自己的手机发送短信提醒,但有一台SSG按照正常方式添加监控主机后,在图形当中始终无法出图、无数据显示。然而另外一台相同配置、相同型号的设备却能够正常出图。后来在网友“摩子”的协助...

    文章 科技探索者 2017-11-09 1284浏览量

  • CactiEZ10.1 不出图诡异故障排查

        在公司部署了一套CactiEZ用于实时监控多个网络设备的工作状态,设置了阈值和宕机短信报警,异常发生时系统会自动给自己的手机发送短信提醒,但有一台SSG按照正常方式添加监控主机后,在图形当中始终无法出图、无数据显示。然而另外一台相同配置、相同型号的设备却能够正常出图。后来在网友“摩子”的协...

    文章 技术小阿哥 2017-12-03 1430浏览量

  • 你知道数据中心宕机的真正成本吗?

    数据中心对企业至关重要,根据调研机构IDC研究表明,之后全球每两年所产生的数据量将会翻一番,这将为企业使用技术增加收入、提高业务绩效提供了更多的机会,而利用这些机会的关键就在于数据中心。但是,随着数据量的增加,数据中心基础设施也面临着更大的压力。 安全提供商赛门铁克公司对2400多名IT专业人士做...

    文章 晚来风急 2017-08-02 846浏览量

1 2 3 4 ... 14 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT