• 评估数据中心改造配电系统

    或者当发现数据中心配电设备由于业务需要需扩容或改造时,这时就可以开始着手分析配电系统,以及与配电系统相关的系统,从而确定是否需要进行改造,或者发现某类配电设备的故障会定期发生,从而导致数据中心运行成本...
    文章 2017-07-04 1346浏览量
  • 项目管理_软件开发的六大阶段

    我们将根据具体情况对安装过程做适当的调整,例如:一些小型财务软件的安装只需要十几分钟,而大型系统,如SAP、JDEdwards、Baan等,其安装需要事先周密计划,各单位统一安装、协调进行,在这期间,我们将要求客户公司...
    文章 2017-11-30 1565浏览量
  • 供电系统设备选用和安装使用问题分析

    无论如何,在数据中心供电系统的采购和安装中我们都要考虑到以上的这些问题,所谓"有备无患",不能埋下任何对数据中心可能产生故障的种子。这样才能保证供电系统的可靠性,提高数据中心应对风险的能力。本文转自d1...
    文章 2017-07-03 831浏览量
  • 数据中心MTBF和AFR如何计算与应用?

    如果两个可比较产品间的故障定义不同,那么进行故障分析就象比较苹果和橙子一样毫无意义。因此,要进行有效的MTBF比较,一项基本任务就是准确分析每个被比较产品的故障组成。因此,对于MTBF计算,供应商应该将哪些...
    文章 2017-07-03 1552浏览量
  • 这些常见的网络故障,你都知道如何解决吗

    故障分析 由于这台交换机是一台可网管交换机,为了避免网络中存在拓扑环,从而导致网络瘫痪,可网管交换机在默认情况下都启用生成树协议。这样即使网络中存在环路,也会只保留一条路径,而自动切断其他链路。所以,...
    文章 2018-10-25 1448浏览量
  • 一线架构师实践指南:证券行业应如何构建一体化监控...

    智能化:系统自带关联分析功能,尤其在设备种类、数量增多的情况下,协助企业实现故障快速、清晰的定位。2、设计准则 一体化监控平台需要秉承以下几个设计理念: 1)框架化 系统是框架清晰的,主要包括两大部分,监控...
    文章 2017-05-02 3326浏览量
  • 如何处理IT事件管理以避免混乱

    其他工具完全集成到服务台系统中,提供用于IT资产管理,根本原因分析和修复的功能,以及使用服务台系统处理提高故障单并向管理员通知正在发生的情况。IT管理供应商,如ManageEngine,BMC软件,SolarWinds,...
    文章 2017-07-03 1122浏览量
  • 数据中心供电系统可用性问题分析

    由于各种设备安装的复杂性,故障发生时对故障根源的分析变得非常困难。客户们普遍希望能够通过全球统一标准的系统收集数据和比较结果,并且规范校正和处理的措施。因此他们希望同一机构内不同场地的机房能够使用同样...
    文章 2017-07-03 996浏览量
  • 数据中心运营的大数据分析与DCIM

    又如,制冷系统中的蓄冷罐温度异常可能由冷机故障引起,也可能由冷机专用变压器或开关故障引起,此时只分析蓄冷罐的温度数据、只分析冷机的状态数据是不够的,还需要跨系统分析电气系统的冷机配电开关和变压器状态的...
    文章 2017-09-15 2607浏览量
  • 运维创新一小步 企业腾飞一大步

    业务发生故障时,业务管理员通过事件相关性能分析及时了解IT故障所影响的业务系统、所涉及的业务部门和故障严重程度;IT管理员通过事件根源性分析可以从大量的事件告警中排查故障根本原因,确定业务恢复时间。本文转...
    文章 2017-11-07 1349浏览量
  • 开源大数据周刊-第45期

    TensorflowOnSpark本文介绍了如何安装Spark&TensorflowOnSpark。(技术)HDFS Federation在美团点评的应用与改进HDFS Federation为HDFS系统提供了NameNode横向扩容能力。然而作为一个已实现多年的解决方案,真正...
    文章 2017-03-17 2189浏览量
  • 5分钟快速完成监控系统搭建之实践篇

    系统的监控运维告警可以帮助企业快速发现系统故障,定位故障和处理故障,对企业业务稳定性起到至关重要的作用。业务监控系统可以实时进行业务告警,进行业务趋势的分析和判断,对于数据化运营起到重要的帮助。阿里云...
    文章 2019-10-30 9735浏览量
  • IDC运营的大数据分析与DCIM

    又如,制冷系统中的蓄冷罐温度异常可能由冷机故障引起,也可能由冷机专用变压器或开关故障引起,此时只分析蓄冷罐的温度数据、只分析冷机的状态数据是不够的,还需要跨系统分析电气系统的冷机配电开关和变压器状态的...
    文章 2019-07-30 1047浏览量
  • 北亚数据恢复中心服务器硬盘故障数据恢复方案

    回迁操作系统时,可以使用linux livecd或win pe(通常不支持)等进行,也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。9、数据移交后,由我数据恢复中心延长保管数据3天,以避免可能...
    文章 2017-11-08 1614浏览量
  • 最后学会故障分析,着重推荐“应用数据迁移网络异常...

    NO.8 本月我们首先了解一下新增的部分实用功能和如何部署Oracle数据库、了解FTP机制、通过Squid代理上网、SSH密钥登录,最后我们还是要学会故障分析,着重推荐“应用数据迁移网络异常案例分析”这篇。应用部署新增...
    文章 2018-07-04 1845浏览量
  • 古瑞瓦特监控系统安装商解除后顾之忧

    江西上饶张老板是一个做分布式光伏系统安装商,从2013年开始,先后安装了上百家光伏电站,随着电站的增加,如何管理成了张老板的一大心事,以前电站较少,还可以每家每户隔几天去看看,现在电站多了,全部查看一次得...
    文章 2017-07-03 1556浏览量
  • 可用性高达五个9!支付系统高可用架构设计实战

    当预防的防线被冲破,如何及时拉起第二道防线,发现故障保证可用性,这时候报警监控系统的开始发挥作用了。一辆没有仪表盘的汽车,是无法知道车速和油量,转向灯是否亮,就算“老司机”水平再高也是相当危险的。同样...
    文章 2017-05-02 1437浏览量
  • 可用性高达五个9!支付系统高可用架构设计实战

    当预防的防线被冲破,如何及时拉起第二道防线,发现故障保证可用性,这时候报警监控系统的开始发挥作用了。一辆没有仪表盘的汽车,是无法知道车速和油量,转向灯是否亮,就算“老司机”水平再高也是相当危险的。同样...
    文章 2018-01-01 1946浏览量
  • 服务器 raid5数据丢失的恢复过程

    回迁操作系统时,可以使用linux livecd或win pe(通常不支持)等进行,也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。9、数据移交后,由北亚数据恢复中心延长保管数据3天,以避免...
    文章 2017-09-06 4020浏览量
  • ChaosBlade x SkyWalking 微服务高可用实践

    服务组件繁多且服务间的依赖错综复杂,很难评估单个故障对整个系统的影响,而且请求链路长,如果监控告警、日志记录等基础服务不完善会造成故障响应、故障定位问题难,所以如何构建一个高可用的分布式系统面临着很大...
    文章 2020-12-09 10901浏览量
  • 《架构师》反思:系统可靠性

    系统故障是指硬件或者软件的错误状态,一般引进故障的原因是这些:部件的失效、环境的物理干扰、操作错误或不正确的设计。按照时间的长短,故障可以分为:永久性、间歇性、瞬时性。故障的级别有:逻辑级故障、数据...
    文章 2016-05-05 4907浏览量
  • 《架构师》反思:系统可靠性

    系统故障是指硬件或者软件的错误状态,一般引进故障的原因是这些:部件的失效、环境的物理干扰、操作错误或不正确的设计。按照时间的长短,故障可以分为:永久性、间歇性、瞬时性。故障的级别有:逻辑级故障、数据...
    文章 2017-11-08 1017浏览量
  • 100个为什么让你了解分布式光伏发电

    资源及应用篇 9、我国太阳能资源是如何分布的?...对于光伏系统设计而言,第一步,也是非常关键的一步,就是分析项目安装使用地点的太阳能资源以及相关气象资料。诸如当地太阳能辐射量、降水量、风速等气象数据,是设计...
    文章 2017-07-03 2378浏览量
  • IBM x3850 RAID5数据恢复方案及过程

    回迁操作系统时,可以使用linux livecd或win pe(通常不支持)等进行,也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。9、数据移交后,由北亚数据恢复中心延长保管数据3天,以避免...
    文章 2017-11-07 917浏览量
  • IBM x3850 RAID5数据恢复方案及过程

    回迁操作系统时,可以使用linux livecd或win pe(通常不支持)等进行,也可以在故障服务器上用另外硬盘安装一个回迁用的操作系统,再进行扇区级别的回迁。9、数据移交后,由北亚数据恢复中心延长保管数据3天,以避免...
    文章 2017-11-15 1053浏览量
  • EVA 4400存储硬盘故障导致数据丢失怎么恢复?

    四、故障分析 1、分析故障原因 由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生。因为EVA控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,EVA控制...
    文章 2017-05-12 2616浏览量
  • 阿里巴巴在混沌工程领域的实践和思考

    因为故障演练之前是作为一个技术组件被嵌入到常态和大促的流程中,所以在系统构建自动化的编排和分析方面的产品度并不高。演练可视化编排和能力开放会是我们团队未来的一个重点,下文中的规划部分会有所阐述。2.5 ...
    文章 2018-12-19 3260浏览量
  • 标准的Windows蓝屏故障分析、处理流程和VMware服务...

    介绍了如何使用WinDbg工具来分析内核转储文件(Crashdump)以确定问题。在文末附带的记录了VMware服务错误的处理记录。操作系统:Windows 7 Enterprise X64 SP1[Version 6.1.7601]。系统用途:这个机器安装的软件较多...
    文章 2017-11-08 1208浏览量
  • 中间件技术及双十一实践·稳定性平台篇

    通常系统的调用都有相关日志记录,通过分析系统的日志等方式获取系统一天当中最大的调用频率(以分钟为单位),我们定义为系统负荷;当前一分钟的调用频率我们定义为当前负荷。计算系统负荷可以先把相关日志传到hdfs...
    文章 2016-04-08 2056浏览量
  • 带你读《智能制造之卓越设备管理与运维实践》之三:运...

    建立统一的故障代码体系,构建设备的故障体系树,以方便问题诊断和故障分析。人力资源管理方面,需要信息化系统提供对于矩阵化组织的管理,实现专业化和综合化的岗位管理。提供在线学习平台和知识库平台来支持员工...
    文章 2019-11-08 1333浏览量
1 2 3 4 ... 42 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化