• 预防宕机靠RAC,和力记易说那就OUT了

    服务器宕机的原因有很多,据不完全统计,“运行环境”是排名第一的服务器宕机类别,大约35%的时间属于这一类。运行环境可以看作是支持数据库服务器运行的系统和资源集合,包括操作系统硬件以及网络等。性能问题...
    文章 2017-08-09 814浏览量
  • MongoDB高可用集群配置的几种方案

    Mongodb的Replica Set即副本集方式主要有两个目的,一个是数据冗余做故障恢复使用,当发生硬件故障或者其它原因造成的宕机时,可以使用副本进行恢复。另一个是做读写分离,读的请求分流到副本上,减轻主(Primary)...
    文章 2016-10-11 21929浏览量
  • OceanBase高可用实践

    分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足,而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%),一个1000台机器规模的集群每天将面临1台机器宕机的风险,...
    文章 2019-07-28 1498浏览量
  • 带你读《KVM实战:原理、进阶与性能调优》之一:虚拟化...

    2.全虚拟化与半虚拟化相反的,全虚拟化(Full Virtualization)坚持第一个理想化目标:客户机的操作系统完全不需要改动。敏感指令在操作系统硬件之间被VMM捕捉处理,客户操作系统无须修改,所有软件都能在虚拟机中...
    文章 2019-10-31 2706浏览量
  • 《Spark大数据分析:核心概念、技术及实践》一 第1章 ...

    HDFS基于通常机器可能宕机这个假设而设计,所以可以处理集群中一台或多台机器的宕机问题。一个HDFS集群包含两种类型的节点:NameNode和DataNode(见图1-3)。Name-Node管理文件系统的命名空间,存储一个文件的所有元...
    文章 2017-05-02 1060浏览量
  • 云原生应用和容器设计模式的综述和展望

    如果我们把系统下层叫做“硬件”,系统上层叫做“软件”,这样说来,固件是跑在硬件上的“软件”,软件是跑在固件上的“软件”,配置是跑在软件上的“软件”,数据是跑在配置上的“软件”。这样,“平台”与“应用”...
    文章 2016-12-13 2434浏览量
  • 服务器建设选择阿里云

    还有,遇到宕机的时候,我们还需要为每个硬件准备冗余,部署与维护成本成本就上去了。同时,增减硬件也是挺麻烦的,带宽也是。有时候需要临时搞活动,硬件需要购置时间。带宽也不能提升,因为我这边的ISP服务商签约...
    文章 2020-07-03 243浏览量
  • IT专业人士不招人喜欢的10大原因

    办公系统或者秘书的电脑宕机时,肯定需要尽快能修好。但有时候IT工程师就像酷热夏日里的空调维修员一样,手上的单子太多,客户必须排队等。但是,对于关键系统来说,哪怕几分钟的宕机时间也是不能忍受的。3:尝试不...
    文章 2012-09-28 1250浏览量
  • 附PPT下载|小邪:新基建之云上IT研发路-基于云架构的...

    例如硬件系统监测+AI故障预测,可以预测磁盘、主板等损坏的时间、故障率、故障诱发原因等指标,提前预警以便迁移应对。云上可以进行热迁移,在预测出故障的情况下及时迁移计算实例,消除故障于无形,宕机率降低到...
    文章 2020-03-30 589浏览量
  • 《云数据管理:挑战与机遇》一第一章

    相反,系统弹性则是动态属性,因为弹性允许系统在不宕机的情况下通过增加服务器进行动态扩展或者通过减少服务器缩减规模。弹性是系统的一个重要属性,其得益于底层云基础设施的弹性。为了能够水平扩展到数千台服务器...
    文章 2017-05-22 859浏览量
  • 《云数据管理:挑战与机遇》一第1章

    相反,系统弹性则是动态属性,因为弹性允许系统在不宕机的情况下通过增加服务器进行动态扩展或者通过减少服务器缩减规模。弹性是系统的一个重要属性,其得益于底层云基础设施的弹性。为了能够水平扩展到数千台服务器...
    文章 2017-05-22 769浏览量
  • 还不懂HDFS的工作原理?快来扫扫盲

    它还要决定当集群的节点宕机或者数据副本丢失的时候系统需要做什么。存储在HDFS上的每份数据片有多份副本(replica)保存在不同的服务器上。在本质上,NameNode是HDFS的Master(主服务器),DataNode是Slave(从服务器)。...
    文章 2017-08-01 786浏览量
  • 带你读《跟老男孩学Linux运维:...计算机硬件与组成基础

    在服务器主板上安装蓄电池,在断电后宕机前瞬间将内存数据回写到磁盘。UPS(一组蓄电池)不间断供电(IDC数据中心机房一般都会用UPS持续供电)。UPS(Uninterruptible Power System/Uninterruptible Power Supply)...
    文章 2019-11-11 938浏览量
  • 服务器建设选择了阿里云

    还有,遇到宕机的时候,我们还需要为每个硬件准备冗余,部署与维护成本成本就上去了。同时,增减硬件也是挺麻烦的,带宽也是。有时候需要临时搞活动,硬件需要购置时间。带宽也不能提升,因为我这边的ISP服务商签约...
    文章 2020-07-06 306浏览量
  • 蚂蚁金服自研数据库OceanBase如何登顶TPC-C

    TPC 的成员主要是业界主流的计算机硬件厂家,其职责是制定企业级应用基准测试考评的标准规范,并且衡量整体系统的性能和性价比,管理测试结果的认证和发布。Oracle、IBM、微软等公司的多个数据库产品曾多次参与这...
    文章 2019-10-05 5772浏览量
  • 《架构师》反思:系统可靠性

    但是可能会导致“单点错”,即系统中某一部件或某个应用程序发生故障时,导致所有系统全部宕机。如磁盘阵列如果出错,可能会导致存储的数据全部丢失。特点:性能较高、可能导致单点错误。(3)光纤通道双机双控集群...
    文章 2016-05-05 4750浏览量
  • 《构建高可用Linux服务器 第3版》—— 1.6 用开源...

    它依靠ping来检测服务器是否存活,如果网络情况不好或因别的原因造成Nagios检测不到监控服务器,会造成一个啼笑皆非的问题,它会狂发报警短信和邮件,说服务器已宕机,属于Critical情况。但事实上此服务器情况良好,...
    文章 2017-07-03 1433浏览量
  • 五分钟了解一致性的分类及其理论

    节点故障则是分布式环境下另一个比较常见的问题,指的是组成分布式系统的服务器节点出现的宕机或"僵死"现象,通常根据经验来说,每个节点都有可能出现故障,并且每天都在发生。CAP理论 一个经典的分布式系统理论。...
    文章 2017-03-27 757浏览量
  • 神不知鬼不觉,阿里程序员把地球多出的1秒“变没”了

    最常见的情况是,如果服务器操作系统是Linux,在一些老的内核版本中存在BUG无法处理闰秒,导致收到闰秒通告消息可能会宕机、插入闰秒可能会宕机、打印闰秒日志也能引发宕机。就说说红帽的老发行版,出现的“Systems ...
    文章 2017-06-20 1414浏览量
  • 系统稳定性——So Hot?快给 CPU 降降温!

    当 CPU 过于繁忙,就像“人脑”并发处理过多的事情,会降低做事的效率,严重时甚至会导致崩溃“宕机”。因此,理解 CPU 的工作原理,合理控制负载,是保障系统稳定持续运行的重要手段。目录 CPU 的物理核与逻辑核 ...
    文章 2019-08-26 926浏览量
  • 黄仁勋打响CES第一枪:全球最强芯DRIVE Xavier武装...

    DGX是全球首款搭载NVIDIA Tesla P100 GPU 加速器的机型,配置28672颗CUDA核心、8片Tesla P100卡,提供完整的系统支持和NVIDIA 云管理门户的访问权,应用管理集成化,提供状态监控,提高产能,缩短宕机时间。...
    文章 2018-01-08 2579浏览量
  • 徐葳:生物医学影像处理、分布式系统与数据共享平台

    但是大数据系统用的是非常便宜的机器,系统内任何一个机器宕机都不会影响整体的运行,这是谷歌设计MapReduce系统的核心。因为只有设备便宜才能跑成规模,价值密度低是大数据的典型特性,成规模的廉价设备使得处理...
    文章 2017-05-02 1023浏览量
  • 《云安全原理与实践》——2.1 云计算面临的技术风险

    当然,为了做到这一点,攻击者必须获得受感染网络上另一台虚拟机的访问权。2.1.4 网络安全风险泛在接入作为云计算服务的五大特征之一,云环境下的网络安全问题也就自然而然地凸显出来。在网络风险方面,云计算主要...
    文章 2017-09-04 2697浏览量
  • DevOps:软件架构师行动指南1.2 为什么是DevOps

    因为升级失败而导致宕机或故障的例子有很多,这只是其中的两个。在一个组织中,正确的部署升级是大型且重要的活动,并且这种活动应该快速完成,并将出错概率降到最低。有几个组织调查了部署的问题。我们报告其中的两...
    文章 2017-05-02 1550浏览量
  • 应用运维——《应用智能运维实践(试读版)》

    系统故障和宕机频率快速升高&xff0c;人工运维成本飙升。著名管理咨询公司麦肯锡在名为Measuring the Net’s Growth Dividend的分析报告中指出&xff0c;2013—2025年&xff0c;互联网将帮助中国的GDP增长率提升0.3&xff5e;1....
    文章 2021-07-06 280浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    在某些情况下硬件能检测错误但是无法校正,并且这些错误要对用户可见,典型如宕机崩溃。静默数据错误。此类错误既没有被硬件检测到,也没有被通知给操作系统,但是数据就是被 CPU 写到了内存,从而无法知道它是错误...
    文章 2021-07-01 2985浏览量
  • 构建微型数据中心——在laptop上运行Rancher

    DevOps工作的主机永远不会宕机。那么,我们该如何做呢?出于写这个博客的目的,我会假设正在Mac或Windows上使用Docker Toolbox。下载安装和说明文件可以在这里找到https://www.docker.com/products/docker-toolbox。...
    文章 2017-11-12 922浏览量
  • 《Ansible权威指南》一1.1 Ansible是什么

    其主要功能是帮忙运维实现IT工作的自动化、降低人为操作失误、提高业务自动化率、提升运维工作效率,常用于软件部署自动化、配置自动化、管理自动化、系统系统任务、持续集成、零宕机平滑升级等。它丰富的内置模块...
    文章 2017-05-22 2048浏览量
  • 玩转ECS第3讲|ECS自助服务之智能诊断和自动化修复

    接下来,进行数据处理,特征数据进入到实时预测模型中,进行非预测宕机模型、可预测宕机模型、混合模型、高准确率、高召回模型;下一步进入投票模型,投票到各种各样的优先级的sls预测数据中,当precision大于50%时...
    文章 2020-10-28 1774浏览量
  • Eric Brewer:容器是云计算的未来

    不过说真的,如果你仔细分析的话,真正的原因其实是Inktomi和Google公司的诞生早于虚拟机的广泛使用,而并不是因为容器当时已存于工具箱中。这听起来像是重温21世纪初我们围绕“效用计算”进行的讨论,其目的是不再...
    文章 2017-09-21 766浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化