连续性检查故障原因

  • 如何进行预防性设备维护

    许多公司仍然将随机设备故障视为一种商业事实。如果维护结构不起作用,就无法避免工作流程中断和惊人的损失。大多数公司都在与安全隐患和低生产率作斗争。这些通常源于未能简化维护,但自动化维护过程可以帮助解决这一问题。公司可以安排例行的维修服务,以便所有资产都得到足够的关注,并及时发现和沟通任何问题。 设...

    文章 物联网IoT996 2020-05-06 96浏览量

  • 走近华佗,解析自动化故障处理系统背后的秘密

    集群医生华佗是集群自动化故障监测和处理系统,是平台和运维对接的关键系统。一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化处理故障的必要性,大...

    文章 yq传送门 2016-12-18 4331浏览量

  • ECS运维:操作系统有异常?诊断日志来帮忙!

    云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器ECS的高可用性。但在使用E...

    文章 践远 2018-07-23 6408浏览量

  • 阿里云试用中心,为您提供0门槛上云实践机会!

    0元试用32+款产品,最高免费12个月!拨打95187-1,咨询专业上云建议!

    广告

  • 在「不可靠」硬件上,分布式数据库如何保证数据可靠性和服务可用性?

    “数据不能丢,服务不能停”,可以说这句话道出了用户对数据库的核心能力的要求。然而,传统的商业数据库必须依赖高可靠的硬件才能实现数据可靠性和服务可用性。OceanBase作为一款成熟的企业级分布式数据库,基于普通PC服务器,就能够做到传统高端硬件环境下的数据可靠性和服务可用性,而且还能做得更好!跟我...

    文章 缪克卢汉 2019-08-06 684浏览量

  • 探究何种原因导致网络数据丢包严重

    许多时候,我们可能都会碰到网络连接时断时续的故障现象,面对这种网络故障,不少网络管理员都会使用Ping命令对网络连通性进行测试,测试结果表明此时的网络传输线路数据丢包现象非常严重,那么究竟是什么因素导致了数据丢包现象比较严重呢?是连接线路接触不稳定?是网络病毒?还是其他的潜在因素?   仔细对这类...

    文章 科技小先锋 2017-11-15 1454浏览量

  • Dell R720服务器错误代码

    系统错误消息显示器中出现的系统消息,通知您系统可能出现的问题。这些消息会参考记录在系统事件日志 (SEL) 中的事件。有关 SEL 和配置系统管理设置的信息,请参阅系统管理软件文档。如果系统具有相关功能,则某些信息还会以缩略形式显示在系统 LCD 中。备注: 此处列出的 LCD 错误消息以简单格式...

    文章 科技小能手 2017-11-12 904浏览量

  • Dell R720服务器错误代码

    系统错误消息显示器中出现的系统消息,通知您系统可能出现的问题。这些消息会参考记录在系统事件日志 (SEL) 中的事件。有关 SEL 和配置系统管理设置的信息,请参阅系统管理软件文档。如果系统具有相关功能,则某些信息还会以缩略形式显示在系统 LCD 中。备注: 此处列出的 LCD 错误消息以简单格式...

    文章 技术小胖子 2017-11-15 1647浏览量

  • 使用Netflix Hystrix编写弹性可容错的应用程序

    弹性指的是在复杂网络环境下,面对各种故障和挑战,仍能提供和维持一个可以接受的服务水平,并正常运作。 -来自Wikipedia 自从长期服务和最近的微服务被大家熟知和使用,很多应用程序开发人员已经将整体式的API,转换成简单的、功能单一的微服务。然而,这样的转换,导致为了保证一致的响应时间和弹性...

    文章 edwardsbean 2015-12-03 2619浏览量

  • OceanBase高可用实践

    背景 高可用是构建分布式系统的基石。一方面,出于成本考虑, 分布式系统往往采取比较廉价的硬件,其可靠性相对于小型机、专有硬件有很大的不足, 而分布式系统的规模一般比较大,假如硬件的可靠性只有三个9(99.9%), 一个1000台机器规模的集群每天将面临1台机器宕机的风险,在如此大规模的情况下,存储...

    文章 KB小秘书 2019-07-28 1322浏览量

  • 网络故障排除连载之二:以太网故障排除

     一、以太网故障排除综述 1、数据链路层;   2、按照实现形式划分以太网;   3、传输介质;   4、传输方式;   5、工作速率;   6、帧格式;   二、以太网常见问题 1、过度冲突 电缆连接距离超过了网络设计规范;  违反了以太网的5-4-3规则,即LA...

    文章 科技小能手 2017-11-15 1018浏览量

  • 『StabilityGuide』| 10+位阿里技术专家共同发起稳定性知识库开源项目

    我们穿过山和大海,也见过人山人海。我们见过各类故障,也排过千雷万险。这一次,不如我们一起,开启稳定性的探索之旅。让无法解决的问题少一点点,让世界的确定性多一点点。 无论是前端业务的开发者,还是后端架构的开发者,都会遇到业务稳定性的难题。但稳定性的话题涉及之广、之深,很难通过一两篇文章道清原委。因此...

    文章 中间件小哥 2019-08-02 5073浏览量

  • 单位内用lk作负载均衡,大家看看

    Steeleye LifeKeeper技术 (一) Steeleye LifeKeeper原理 Steeleye LifeKeeper定义、特性、资源保护 LifeKeeper For Windows 2000 提供了一个完全容错的软件解决方案,并提供数据、应用程 序和通信资源的高度可用...

    文章 余二五 2017-11-20 655浏览量

  • 负载均衡进阶:SLB常见问题解决方法

    摘要:在由云栖社区和阿里云网络团队联合主办的2017阿里云网络技术在线高峰论坛上,阿里云技术专家添毅分享了网络产品部根据客户和阿里云运维的反馈提炼出的几大最主要和最常见的在使用SLB产品中发生的问题,并为大家介绍了针对这些常见问题的相应处理方法。想知道如何借助SLB构建高可用系统以及健康检查是如何...

    文章 场景研读 2017-10-09 9698浏览量

  • 一个专业网管的工作笔记(超级珍藏)

    第1章 故障处理方法  一、网络的复杂性  一般网络包括路由、拨号、交换、视频、WAN(ISDN、帧中继、ATM、…)、LAN、VLAN、…  二、故障处理模型  1、 界定问题(Define the Problem)  详细而精确地描述故障的症状和潜在的原因  2、 收集详细信息(Gather ...

    文章 技术小甜 2017-11-07 931浏览量

  • 云计算设计模式(二)——断路器模式

    云计算设计模式(二)——断路器模式处理故障连接到远程服务或资源时,可能需要耗费大量的时间。这种模式可以提高应用程序的稳定性和灵活性。 背景和问题 在分布式环境中,如在云,其中,应用程序执行访问远程资源和服务的操作,有可能对这些操作的失败是由于瞬时故障,如慢的网络连接,超时,或者被过度使用的...

    文章 杨振平 2014-11-04 622浏览量

  • 一文总结:分布式一致性技术是如何演进的?

    分布式一致性 分布式一致性,简单的说就是在一个或多个进程提议了一个值后,使系统中所有进程对这个值达成一致。 为了就某个值达成一致,每个进程都可以提出自己的提议,最终通过分布式一致性算法,所有正确运行的进程学习到相同的值。 工业界对分布式一致性的应用,都是为了构建多副本状态机模型(Replicat...

    文章 茶什i 2020-07-24 1294浏览量

  • 应对亿级访问,另辟蹊径实现MySQL主库高可用

       关于如何实现MySQL主库高可用,是一个老生常谈的问题了,目前开源方案主要有MHA和MMM,各有优缺吧。笔者比较推崇的一个原则是“引入尽可能少的东西来满足需求”,所以先想到了“经典”的双主+keepalived架构。关于这个架构,网络上的资料基本都仅停留在对server和MySQL进程层面的...

    文章 努力酱 2017-05-02 1336浏览量

  • 如何做好一名稳定性SRE--业务团队系统稳定性的思与行

    前言 2013年,当我第一次接触稳定性的时候,我是有些懵的,当时完全不知道稳定性是什么,也不清楚要做什么。在接下来的8年里,我先后在菜鸟、天猫、盒马从事中间件、业务系统、架构等方面的工作,期间一直穿插着负责稳定性和大促的保障工作。我的心态,大致经历过以下几个阶段: low:完全不懂,觉得稳定性就...

    文章 茶什i 2020-10-26 1234浏览量

  • 向真正的互联企业迈出第一步

    物联网如何推动未来几十年最重要的商业趋势之一。 如果你认识数据中心的工作人员,花点时间感谢他们。毕竟,正是因为有了它们,我们居家隔离时才能在网上购物,在Netflix上观看《Tiger King》。 这些工作人员和他们的团队在COVID-19危机期间一直在不知疲倦地工作,以保持互联网的运行。尽管全...

    文章 物联网IoT996 2020-07-22 45浏览量

  • 如何检测 Web 服务请求丢失问题

    导读 『StabilityGuide』是阿里多位阿里技术工程师共同发起的稳定性领域的知识库开源项目,涵盖性能压测、故障演练、JVM、应用容器、服务框架、流量调度、监控、诊断等多个技术领域,以更结构化的方式来打造稳定性领域的知识库,欢迎您的加入。 @GitHub :https://github.co...

    文章 中间件小哥 2019-09-16 1733浏览量

  • 在医疗保健中实施物联网的利弊

    物联网(IoT)在生活的各个领域(尤其是医疗保健系统)都迅速得到普及。简而言之,该技术允许多个连接的设备相互收集和共享信息。 这对医疗保健意味着什么? 实际上,这些应用程序是如此的多样化,以至于您可能不会相信这些示例来自现实生活。这里仅仅是少数: 1)症状跟踪应用程序可以将对癌症治疗反应的更...

    文章 物联网IoT996 2020-04-05 46浏览量

  • 《Oracle数据库性能优化方法论和最佳实践》——第1章 Oracle性能优化漫谈 1.1 从生活场景漫谈性能优化

    本节书摘来自华章计算机《Oracle数据库性能优化方法论和最佳实践》一书中的第1章,第1.1节,作者:柳遵梁 潘敏君 应以峰著,更多章节内容可以访问云栖社区“华章计算机”公众号查看 第1章Oracle性能优化漫谈 1.1 从生活场景漫谈性能优化 Oracle数据库性能优化一直是一个让人既胆怯又兴奋...

    文章 华章计算机 2017-05-02 1015浏览量

  • Facebook TSDB论文翻译

    本文为Facebook官方论文的翻译,原文地址http://www.vldb.org/pvldb/vol8/p1816-teller.pdf 概要 大型互联网服务一般以出现故障及时响应和保持高可用性为目标。为了提供正常稳定的服务,通常要每秒从大量系统中监控和分析数以千万计的数据(性能数据和业务数...

    文章 焦先 2017-08-18 1784浏览量

  • 130 秒揭秘 EDAS 3.0 如何平滑应对突发流量高峰,为您的业务保驾护航

    "在 PaaS 层面,我们始终拥抱开源技术,并保持和社区版本兼容的时效性;在企业特性上,例如服务治理、应用监控等方面,我们提供一个稳定成熟的产品,来降低企业构建互联网化应用的门槛,例如企业级应用服务 EDAS3.0 就是这样一个典型的产品"——阿里巴巴合伙人、阿里云智能基础产品事业部 高级研究员蒋...

    文章 中间件小哥 2020-10-12 1988浏览量

  • Cassandra 在 360 的实践与改进

    供宽表数据库选型参考 11月16日在北京,由DataFun和阿里云联合举办的首场Cassandra中文社区线下meetup,奇虎360王锋老师分享了在360的应用,针对HBase和C的选型,C的优缺点及改进方案做了分享,最多时达一万四千节点,值得细细品读。 以下文章来源于DataFunTalk ,...

    文章 茶什i 2019-12-30 186浏览量

  • 【译】Berkeley DB 设计经验

    英文原文链接:http://www.aosabook.org/en/bdb.html 中文翻译连接:http://www.ituring.com.cn/article/details/8111  作者:Margo Seltzer 和 Keith Bostic 康威法则(Conway’s law)说...

    文章 wenliang.zhang 2016-10-10 1720浏览量

  • 选择一个日志文件系统

    通俗的说,计算机的文件系统就是一个像磁盘这样的存储设备如何存储、检索以及管理文件的方式。文件系统需要记录的不仅是文件本身每一个字节,及其在存储设备上的位置,还要存储文件相关的信息。比如,也要存储每个文件的名字、文件存放的层次结构(目录),还有文件的元数据,像文件的修改时间等。 虽然在linux上可...

    文章 知与谁同 2017-05-02 1265浏览量

  • data gurad物理备份方式中的failover转换

    切换分为switchover和failover,前者是无损切换,不会丢失数据,而后者则有可能会丢失数据,并且切换后原primary 数据库也不再是该data guard 配置的一部分了.针对不同standby(逻辑或物理)的处理方式也不尽相同 角色转换前的准备工作 检查各数据库的初始化参数,主要...

    文章 eric0435 2016-05-13 1040浏览量

  • 某金融公司实践 | 从SRE&DevOps&PE谈如何颠覆应用运维认知

    导读:[GO SRE!] 为数人云SRE系列活动专题,本文是北京站线下活动“当西方的SRE遇上东方的互联网”中某金融王超老师的分享。 他将从SRE,Devops, PE间的关系开始,介绍企业该如何构建适合自己的运维组织架构并管理团队,讲解持续交付、监控、容量规划等具体运维场景实操,从工程实践的角度...

    文章 行者武松 2017-08-01 1471浏览量

  • 如何将bug杀死在摇篮里?

    在欧洲中世纪的传说中,有一种叫“人狼”的妖怪,就是人面狼身。它们会讲人话,专在月圆之夜去袭击人类。而且传说中对“人狼”用一般的枪弹是不起作用的,普通子弹都伤不到也打不死它,只有一种用银子作成的特殊子弹才能把它杀死。Brooks在他最著名的随笔文章《No Silver Bullet》里引用了这个典故...

    文章 技术小能手 2017-06-29 2223浏览量

1 2 3 4 6 >

云产品推荐

阿里云大学 云服务器ECS com域名 网站域名whois查询 开发者平台 小程序定制 小程序开发 国内短信套餐包 开发者技术与产品 云数据库 图像识别 开发者问答 阿里云建站 阿里云备案 云市场 万网 阿里云帮助文档 免费套餐 开发者工具 企业信息查询 小程序开发制作 视频内容分析 企业网站制作 视频集锦 代理记账服务 企业建站模板