• 如何将机器学习应用于预测性维护

    这一概念包括预测部件何时出现故障,并有助于更好地预测部件或机器在其生命周期中的哪个阶段会出现故障。早期故障检测。在这种情况下,我们可以通过将传感器数据应用于机器学习算法,在故障发生之前检测出故障。最大...
    文章 2020-06-10 563浏览量
  • 图解故障服务器下线:关于阿里云MongoDB高可用的探秘

    服务器容灾一直是云服务运维过程中无法避开的问题,我们常常讨论如何对出现故障的机器进行数据库方面的恢复,却很少考虑到在机器出现故障后,是用一套怎样的处理流程将三节点副本集恢复如初的。MongoDB采用的是...
    文章 2017-03-28 8136浏览量
  • 浅谈IT运维

    运维人员在做这类工作的时候不能像应付任务那样,但求过关即可,否则日积月累下来,服务器会出现意想不到的情况。在处理这类工作上运维人员应当做到规范和文档记录,长期做下来,不但自己的运维专业水平会提高,对于...
    文章 2017-11-20 1430浏览量
  • Rook:基于Ceph的Kubernetes存储解决方案

    如果某个Mon出现故障,并且没有重新启动,操作器往quorum中添加一个新的mon,并将失效的移除quorum 更新Ceph客户端和Daemons的IP地址 Mgr Mgr是一个无状态服务,提供集群信息。除了启动核心功能外,Rook还参与配置...
    文章 2018-12-18 2461浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    不同级别其细度有所不同,设备维修时系统自动从下而上匹配维护策略决策树内容,根据预选的配置给出最合适的维修决策指导。信息以维护策略地图的形式(如图3-12所示)直观地展示机型各个部位的维护设定情况,比如...
    文章 2019-11-08 1226浏览量
  • UPS电源日常维护与检修

    2、定期维护 在UPS中,仅在用于冷却功率驱动器件的散热风扇中存在有可动的机械部件,其余部件由固态电子元件构成,且风扇都是长寿命设计的,因此不存在磨损的问题。基于上述原因,除确保UPS总是运行在恒温和洁净工作...
    文章 2018-11-09 1236浏览量
  • 易比克工程师解答:UPS不间断电源正确使用方法

    5、电池维护UPS的电池组存在自放电现象,如果长期放置不用导致电池组的损坏,因此需要定期进行充放电。如果使用时免维护的吸收式电解液系统电池,在正常使用时不会产生任何气体,但是如果用户使用不当而造成了...
    文章 2019-08-05 554浏览量
  • 100个为什么让你了解分布式光伏发电

    电网停电后,分布式光伏发电系统一般都会退出运行,不能正常发电,但在某些极端情况下可能会出现孤岛现象,即电网停电后分布式发电系统仍然带着部分负荷继续运行,影响检修人员人身安全,并存在陨坏家用电器及电网...
    文章 2017-07-03 2367浏览量
  • 还不知道如何实践微服务的Java程序员,这遍文章千万...

    事实上,在大访问量的生产场景下,故障总是会出现的。服务数量非常多,部署、管理的工作量很大。开发方面:如何保证各个服务在持续开发的情况下仍然保持协同合作。测试方面:服务拆分后,几乎所有功能都会涉及多个...
    文章 2019-08-27 1411浏览量
  • 使用SQL Server维护计划实现数据库定时自动备份

    (说明:我在SQL2008中文版虚拟机里面做的时候一旦修改维护计划,保存的时候就报错灾难性故障,不过我本机的英文版是正常的,不知道是我虚拟机的问题还是中文版的Bug,反正在英文版里面是对的。这样修改后,以后我们...
    文章 2016-05-09 2565浏览量
  • 3+1保障:高可用系统稳定性是如何炼成的?

    热点或极限值处理业务规模以及数据规模大的部分系统,在系统中会出现数据热点、数据极度倾斜、少量大客户超过极限阈值使用等极限场景,例如超级大客户广告投放物料、广告点击展示数据、API调用频次都是比普通客户大...
    文章 2021-01-27 8367浏览量
  • ITIL部署实施系列之变更管理

    一般情况,由变更人员执行即可,例如ERP的维护人员可以根据需要添加和删减用户,但对于企业关键用户,如上级部门、关联部门等的请求,一般要经过CAB尤其是主管的认可,这是为了确保信息的查阅级别,以确保企业里层级...
    文章 2017-11-27 1357浏览量
  • RAC集群简介(原创)

    这个进程建立到数据库的持久连接,定期检查SGA中的特定信息,该信息由PMON 进程定时更新。OPROCD OPROCD 这个进程也叫作 Process Monitor Daemon.如果在非Linux 平台上,并且没有使用第三方的集群软件时,就看到...
    文章 2016-05-24 1694浏览量
  • 全是干货-Linux 高可用(HA)集群基本概念详解

    当主服务器出现故障时,从服务器就自动挂载数据库文件,并接替主服务器的工作。用户在未通知的情况下,通过从数据库连接到数据库文件进行操作。等主服务器的故障修复之后,又可以重新提供服务;那么,从服务器是...
    文章 2016-05-16 6145浏览量
  • 如何成为优秀的技术主管?你要做到这三点

    由于人的思维是发散性的,所以往往在产品构思的过程中会出现各种新鲜好玩的想法,这些想法可能来自领导或者产品经理自己,但是这些想法往往都是和产品核心方向不相关的,但是由于这些想法能够在当时带来诱惑,因此...
    文章 2019-02-27 9911浏览量
  • 表格存储如何实现跨区域的容灾

    图中的Write-ahead log也称为commitlog,一条数据更新先写入commitlog进行持久化,然后再写入内存中的MemTable,MemTable会定期的flush成一个新的数据文件,后台定期对不同的数据文件进行compaction,合并为一个更...
    文章 2017-11-08 6204浏览量
  • 什么样的云数据库架构选型才能做到安全,稳定又可靠?

    刚刚接触数据库的同学可能不太了解可维护时间这个概念,其实可维护时间和之前提到的链路是紧密相关的,通常情况下即使自己搭建数据库,也会出现数据库损坏、升级、重启或者网络需要进行变更的时候,这个时候连接一定...
    文章 2017-05-19 5009浏览量
  • 《深入理解Hadoop(原书第2版)》——2.3Hadoop系统的...

    如果此时其访问的数据节点出现故障,就访问存放备份数据块的数据节点。3)读取数据块的时候计算该数据块的校验和,并将该校验和与写入文件时的校验和作比较。如果检验失败,则从其他数据节点获取备份数据块。...
    文章 2017-05-02 1401浏览量
  • 如何健壮你的后端服务?

    在需求分析阶段,单一职责原则可以界定我们服务的边界,如果服务边界如果没界定清楚,各种合理的不合理的需求都接,最后导致服务出现不可维护、不可扩展、故障不断的悲哀结局。对于架构来讲,单一职责也非常重要。...
    文章 2015-12-04 5488浏览量
  • Oracle OS备份了解

    COTS解决方案一般会包含许多附加条件,而且有时候会有比维护计划或自行开发解决方案更多的特性。维护计划解决方案非常容易实现,并且有足够的功能为大多数组织实现可靠的备份解决方案。如果有一些特殊的备份需求,...
    文章 2016-02-29 1301浏览量
  • Facebook TSDB论文翻译

    大型互联网服务一般出现故障及时响应和保持高可用性为目标。为了提供正常稳定的服务,通常要每秒从大量系统中监控和分析数以千万计的数据(性能数据和业务数据)。一个特别高效的解决方案是用TSDB对这些数据进行...
    文章 2017-08-18 2178浏览量
  • Redis主从复制与优化

    redis在删除key时有两种策略,一种是懒惰型策略,即只有当redis操作这个key时才将key删除,第二种是定期采样key删除-当key数据非常多时,采样速度比不上key生成速度造成很多过期数据没有删除,因为redis一般都是...
    文章 2020-10-13 1898浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    区分责任,当出现故障时,区分清楚责任,到底是稳定性工作没有做到位,还是做到位了,但是团队同学疏忽了,还是说只是单纯的业务变化;1.3,开发和SRE的区别 都是做技术的,很多开发刚刚转向负责稳定性时,有些弯转...
    文章 2020-10-26 4468浏览量
  • 从阿里、腾讯的面试真题中总结了这11个Redis高频面试...

    另外也有一个更为简单粗暴的方法,如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间很短,最长不超过五分钟。通过这个直接设置的默认值存放到缓存,...
    文章 2020-04-02 1178浏览量
  • 流计算引擎数据一致性的本质

    此外,同其他分布式应用一样,流计算系统经常也受到各类意外因素的影响而发生故障,比如流量激增、网络抖动、云服务资源分配出现问题等,发生故障后重新执行计算,在存在不确定输入的前提下设计健壮的容错机制难度...
    文章 2021-10-12 2059浏览量
  • 高可用互联网系统稳定性建设实践指南

    在系统中会出现数据热点、数据极度倾斜、少量大客户超过极限阈值使用等极限场景&xff0c;例如超级大客户广告投放物料、广告点击展示数据、API调用频次都是比普通客户大很多&xff0c;如果按照客户维度分库分表&xff0c;基本...
    文章 2021-09-01 62浏览量
  • HDFS追本溯源:体系架构详解

    DN与数据块的对应关系,即数据块存储在哪些DN中:在DN启动时上报到NN它所维护的数据块。这个是动态建立的,不会持久化。因此,集群的启动可能需要比较长的时间。而DN则保存了数据块。并且执行NN的命令,比如复制,...
    文章 2014-04-11 2081浏览量
  • 这可能是你见过最好的Redis主从复制原理

    每次当 slave 和 master 之间的连接断开时,slave 自动重连到 master 上,并且无论这期间 master 发生了什么,slave 都将尝试让自身成为 master 的精确副本。该系统的运行依靠三个重要机制: 当一个 master 实例和...
    文章 2020-09-06 2732浏览量
  • Redis在新浪微博中的应用

    上升到一定规模后,可能会出现什么问题,是否能接受?google code上,国外论坛找材料(国内比国外技术水平滞后5年)观察作者个人的代码水平 Redis应用场景 1.业务使用方式 hash sets:关注列表,粉丝列表,双向关注列表...
    文章 2017-11-19 1590浏览量
  • Redis面试题汇总(附答案),面试突击专用

    另外也有一个更为简单粗暴的方法,如果一个查询返回的数据为空(不管是数据不存在,还是系统故障),我们仍然把这个空结果进行缓存,但它的过期时间很短,最长不超过五分钟。通过这个直接设置的默认值存放到缓存,...
    文章 2020-12-08 1363浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化