• 关于

    周期故障原因

    的搜索结果
  • 萨纳斯光伏大数据体系之光伏设备运行分析

    导读:随着光伏电站规模的不断扩大,光伏设备的数量也在增加。而光伏电站一般地处偏远地带,运维人员较少,为保证光伏电站的安全、高效、低成本运行,就势必要对电站设备运行水平进行全面准确分析,精准运维。 光伏电站的设备组成: 光伏电站设备是光伏电站的基本支撑,一般由气象站、太阳能电池阵列、汇流箱、直流柜、...

    文章 寒凝雪 2017-07-03 1032浏览量

  • 在大规模 Kubernetes 集群上实现高 SLO 的方法

    作者 | 蚂蚁金服技术专家 姚菁华;蚂蚁金服高级开发工程师 范康 导读:随着 Kubernetes 集群规模和复杂性的增加,集群越来越难以保证高效率、低延迟的交付 pod。本文将分享蚂蚁金服在设计 SLO 架构和实现高 SLO 的方法和经验。 Why SLO? Gartner 对 SLO 的定义...

    文章 阿里巴巴云原生小助手 2020-11-06 3001浏览量

  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不知道!

    摘要:业务通过产品技术发挥价值的一个必要条件就是可以在线上稳定持续的运行,这一直是运维人员的终极目标。相信大家在使用天猫、淘宝、支付宝时几乎没有遇到过无法使用的情况,阿里是如何做到的呢?AIOps又是什么?本文主要关注线上业务的研发和运维流程,由阿里云高级技术专家向大家介绍如何将机器学习算法引入运...

    文章 聒小小噪 2018-05-30 11053浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    100+款试用云产品,最长免费试用12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 避免数据中心的停机 节省真金白银!

    随着大量数据应用和业务量的激增,对大多数企业来说数据中心安全运行至关重要。然而,大多数企业低估了维护数据中心安全运行的重要性。据统计,数据中心的停机一分钟平均损失将超过8800美元。 那么,数据中心停机的原因是什么?又该如何避免这么此类事件发生呢? 以下是数据中心停机的一些最主要的原因: UP...

    文章 晚来风急 2017-08-02 791浏览量

  • 避免数据中心的停机 节省真金白银!

    随着大量数据应用和业务量的激增,对大多数企业来说数据中心安全运行至关重要。然而,大多数企业低估了维护数据中心安全运行的重要性。据统计,数据中心的停机一分钟平均损失将超过8800美元。 那么,数据中心停机的原因是什么?又该如何避免这么此类事件发生呢? 以下是数据中心停机的一些最主要的原因: UP...

    文章 祁同伟 2017-07-31 1275浏览量

  • 带你读《智能制造之卓越设备管理与运维实践》之三:运维资源信息化管理

    点击查看第一章点击查看第二章 第3章 运维资源信息化管理要实现高效运维,首先要实现资源的高效管理。借助信息化手段,可以将运维资源中的技术、员工、备件、数据进行有效整合,为高效运维奠定良好的基础。本章的结构如图3-1所示。 3.1 管理需求 基于精益管理思想,工厂在生产管理过程中,会通过各种方式来...

    文章 温柔的养猫人 2019-11-08 773浏览量

  • 缺陷预防之RCA实践小记

    RCA背景、概念、开展目的 IOWA 州立大学质量管理学 院认为:很多公司在设备发生故障后,都能够很快修复,但往往很难发现哪些是引起这些故障的根本原因,这样会导致故障会再次发生。这里所说的根本原因,是指 导致设备失效的基本原因,如果该原因得到纠正,将会避免该事故重发。根本原因分析技术是一个发现和消...

    文章 玄学酱 2017-07-10 1595浏览量

  • 【监控杂谈之异常检测】什么是异常

    写在系列开头 集团在异常检测方面做了很多积淀,本系列将开始总结一些常见的问题以及解决办法,为后来人或者感兴趣的人快速上手,权当抛砖引玉,如有兴趣或者问题可以留言或@冷愁 本章作为整体概述,站在运维的角度、日常应急处理的视角,描述现有遇到的问题,在后续的篇章中会针对每一个遇到的问题提供响应的解决方案...

    文章 冷愁 2016-08-05 5815浏览量

  • 飞天技术汇 | 阿里云发布ECS运维体系,提供原生运维能力

    作为运维人员你是否遇到过 大量ECS资源不知如何管理和部署? 不知ECS发生宕机或意外重启的原因? 哪些故障响应机制可保障业务连续性? 我们知道,故障几乎无法完全避免,但如果总是在故障发生时才靠运维人员来解决问题,不仅太被动,对业务连续性也有非常高威胁。 所以,“主动”运维显得尤为重要。 8月8...

    文章 阿里云头条 2018-08-13 1991浏览量

  • 数据中心设计建造中的八个事实

    本文指出了数据中心设计建造中的八个事实,看看你是不是还被蒙在鼓里呢?   1.只要有功率输入,即有热量输出 在数据中心的供电系统中,绝大部分电能是要转化成热量的,只有少数电能是真正得到利用的。这是由于数据中心的供电线路存在电阻所致,除非你的数据中心采用超导体供电,否则你将永远为这些散失到空间里的热...

    文章 青衫无名 2017-09-01 930浏览量

  • 当前数据中心运维管理工作中存在的问题

    教据中心建设作为一种战略投入基本上已经形成共识,但是在巨额的投入后仍面临着种种问题与风险,面临着数据量急速膨胀,场地严重不足,运营成本高昂、能耗大、安垒性差,业务连续能力低等一系列挑战。 在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理就...

    文章 沉默术士 2017-07-03 829浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4505浏览量

  • 超全总结 | 阿里如何应对电商故障?神秘演练细节曝光

    近日,在 QCon北京2017大会上,来自阿里巴巴中间件团队的技术专家周洋(花名中亭)发表了题为《阿里电商故障治理和故障演练实践》专题演讲。在会后官方组织的评选中,本次演讲的内容得到了一致好评,中亭获选为本次大会的明星讲师。此次演讲整体上分享了从 2011 年至今,阿里巴巴电商平台遇到的诸多有代表...

    文章 技术小能手 2017-06-19 3460浏览量

  • 《 自动化测试最佳实践:来自全球的经典自动化测试案例解析》一一2.6 管理自动化测试

    2.6 管理自动化测试我们的测试过程在持续改进,并且我们为测试设计了一个可记录的生命周期,如图2-2所示。测试被开发出来之后,会进行评审,如果审查通过,这个测试就会被包含到候选队列中(一个测试集合用来尝试是否应该包含到整个自动化套件中)。如果一个候选测试在一行中有4天都失败了,那么它会被提取出来重...

    文章 华章计算机 2017-08-02 739浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 隐林 2018-11-24 3341浏览量

  • 阿里如何做到百万量级硬件故障自愈?

    随着阿里大数据产品业务的增长,服务器数量不断增多,IT运维压力也成比例增大。各种软、硬件故障而造成的业务中断,成为稳定性影响的重要因素之一。本文详细解读阿里如何实现硬件故障预测、服务器自动下线、服务自愈以及集群的自平衡重建,真正在影响业务之前实现硬件故障自动闭环策略,对于常见的硬件故障无需人工干预...

    文章 技术小能手 2018-11-19 2729浏览量

  • 云计算设计模式(十八)——重试模式

    云计算设计模式(十八)——重试模式 启用应用程序来处理预期的,暂时的失败时,它会尝试连接到由透明的重试操作了以前失败的期望,失败的原因是瞬时的服务或网络资源。这种模式可以提高应用程序的稳定性。 背景和问题 该通信的应用程序与在云中运行的元素必须是可能发生在这样的环境中的瞬时故障敏感。这些...

    文章 杨振平 2014-11-07 665浏览量

  • 浅析单点故障以及云上高可用和容灾

    引言 故障,不管它发生的概率有多低,终归还是会发生的。                                                                                     ...

    文章 尘轩 2017-09-27 4640浏览量

  • Hyper-V Server Replica

    Hyper-V Server副本技术伴随着Windows Server 2012、Hyper-V Server 2012一同发布的新技术,他是Hyper-V 2012/R2中的免费灾难恢复工具,用于创建和维护虚拟机(VM)副本。在有灾难性的损失的情况下,管理员可以转移到副本虚拟机,保障了业务连续性...

    文章 技术小胖子 2017-11-03 866浏览量

  • Hyper-V Server Replica

    Hyper-V Server副本技术伴随着Windows Server 2012、Hyper-V Server 2012一同发布的新技术,他是Hyper-V 2012/R2中的免费灾难恢复工具,用于创建和维护虚拟机(VM)副本。在有灾难性的损失的情况下,管理员可以转移到副本虚拟机,保障了业务连续性...

    文章 技术小胖子 2017-11-10 920浏览量

  • 《电子元器件的可靠性》——1.2节质量观与可靠性概念

    本节书摘来自华章社区《电子元器件的可靠性》一书中的第1章,第1.2节质量观与可靠性概念,作者王守国,更多章节内容可以访问云栖社区“华章社区”公众号查看 1.2 质量观与可靠性概念1.2.1 当代质量观质量是企业的生命线,质量管理是企业管理的主线,是永恒的主题。国内某著名企业的大门上贴出这样一副对联...

    文章 华章计算机 2017-07-03 1216浏览量

  • 阿里云对象存储 OSS 发布全球第一可用性 SLA 背后的技术体系

    一、概述2020年6月,阿里云对象存储 OSS 通过十年积累的技术红利,将可用性 SLA(Service Level Agreement) 提升 10 倍,做到了全球第一的核心竞争力,是其他的云厂家的 10~20 倍,如下图所示。其中, OSS 的标准型(同城冗余)存储,SLA 从 99.95% ...

    文章 阿里巴巴存储技术 2020-06-17 231浏览量

  • 如何排查Java内存泄露(内附各种排查工具介绍)

    今天刚刚才加一个故障review会议, 故障非常典型, google下也可以找到相似案例介绍。 在排查问题的过程中,使用了大量的工具, 发现有问题的地方还不只一个,总结一下. (本篇文章不会重点描述案例本身,重点会介绍个人对java内存泄露问题的排查思路和各种工具的使用)。 java内存泄露典型特...

    文章 不闻 2016-09-30 19700浏览量

  • 智慧高速公路与新基建的融合与发展

    2019年9月,交通运输部关于印发《数字交通发展规划纲要》,对我国数字交通的发展进行了规划,提出促进先进信息技术与交通运输深度融合,以“数据链”为主线,构建数字化的采集体系、网络化的传输体系和智能化的应用体系,加快交通运输信息化向数字化、网络化、智能化发展,为交通强国建设提供支撑的总体目标。文件提...

    文章 rainmanjin 2020-11-04 257浏览量

  • 托管节点池助力用户构建稳定自愈的 Kubernetes 集群

    作者 | 谢瑶瑶(初扬) 来源|阿里巴巴云原生公众号 随着容器技术的不断发展迭代,Kubernetes 已成为云原生时代的标准操作系统,那么如何构建一个稳定自愈的云原生操作系统事关重大。尤其是分布式环境下,各类硬件和软件故障已成为常态,直接导致 Kubernetes 集群工作节点时常处于一种不稳定...

    文章 阿里巴巴云原生小助手 2021-02-02 3144浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4746浏览量

  • KubeNode:阿里巴巴云原生 容器基础设施运维实践

    作者 | 周涛  阿里云技术专家来源 | 阿里巴巴云原生公众号阿里巴巴节点运维的挑战在阿里巴巴的场景下,做节点运维面临的挑战主要来自于这几个方面:规模、复杂性、稳定性。首先是规模大。从 18 年第一个集群的搭建,到现在线上共运行着数百个 ASI 集群、数十万个节点,其中单集群的节点数最多有超过1万...

    文章 阿里巴巴云原生小助手 2021-03-11 595浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的智能化之路

    导言 后羿:阿里巴巴资深技术专家,参与8年双11大战,主导阿里“去IOE”战略落地,目前在推动阿里基础设施智能化。 后羿此次给大家分享的是双11的智能化网络实践,关于如何在网络智能领域通过数据手段极致地优化运营场景,在稳定性、成本、效率方面提升网络运营竞争力,给大家呈现了阿里巴巴在双11中主要依赖...

    文章 初商 2019-07-31 810浏览量

  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化实践

    12月13-14日,由云栖社区与阿里巴巴技术协会共同主办的《2017阿里巴巴双11技术十二讲》顺利结束,集中为大家分享了2017双11背后的黑科技。本文是《双11的智能化网络实践》演讲整理,主要讲解了阿里巴巴在网络智能化技术中,大量级网络下网络变更、调度优化技术的大幅度提升,故障快速发现、定位、恢...

    文章 zengzengzeng 2017-12-14 1798浏览量

  • 北亚数据恢复中心服务器硬盘故障数据恢复方案

    【基本信息】 服务器型号:IBM X3850服务器, 硬盘型号:73G SAS硬盘, 硬盘数量:5块硬盘 其中4块组成一个RAID5,另一块做为热备盘(Hot-Spare), 操作系统:linux redhat 5.3,应用系统为构架于oracle的一个oa。 【故障表现】 3号盘早已经离线,但...

    文章 北亚企安 2017-11-08 1459浏览量

1 2 3 4 ... 28 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT