• 关于

    故障点会出现哪些问题

    的搜索结果
  • 如何将机器学习应用于预测性维护?

    云栖号资讯:【点击查看更多行业资讯】在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 通过使用机器学习,结合从工业物联网(IIOT)设备收集的数据,可以改进流程、降低成本并提高效率。 预测性维护应用数据和模型来预测设备或资产何时发生故障。这种方法可以通过预测故障,来帮助公司主动解决...

    文章 云栖号资讯小哥 2020-06-10 314浏览量

  • 《路由设计的优化》一1.3 可靠性和弹性

    本节书摘来自异步社区《路由设计的优化》一书中的第1章,第1.3节,作者【美】Russ White , Don Slice , Alvaro Retana,更多章节内容可以访问云栖社区“异步社区”公众号查看 1.3 可靠性和弹性 路由设计的优化如果网络不转发网络设备之间的数据,那么应用程序就无法正常...

    文章 异步社区 2017-05-02 1085浏览量

  • 经验之谈:内存问题造成数据库性能异常怎么破?

    云栖号:https://yqh.aliyun.com第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策! 导读:在使用数据库的过程中,内存不足常常会引起数据库异常。但是内存不足,又会为数据库带来哪些具体的影响呢?本次,我们将通过某客户现场数据库在某个...

    文章 云栖号资讯小编 2020-03-11 385浏览量

  • 经验:探索内存问题如何造成数据库性能严重异常

    云栖号:https://yqh.aliyun.com第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策! 导读:在使用数据库的过程中,内存不足常常会引起数据库异常。但是内存不足,又会为数据库带来哪些具体的影响呢?本次,我们将通过某客户现场数据库在某个...

    文章 云栖号资讯小编 2020-02-28 475浏览量

  • 还不知道AIOps嘛?阿里这么火的智能运维,你不能不知道!

    摘要:业务通过产品技术发挥价值的一个必要条件就是可以在线上稳定持续的运行,这一直是运维人员的终极目标。相信大家在使用天猫、淘宝、支付宝时几乎没有遇到过无法使用的情况,阿里是如何做到的呢?AIOps又是什么?本文主要关注线上业务的研发和运维流程,由阿里云高级技术专家向大家介绍如何将机器学习算法引入运...

    文章 聒小小噪 2018-05-30 10925浏览量

  • 架构设计 | 分布式体系下,服务分层监控策略

    一、分布式故障 分布式系统的架构,业务开发,这些在良好的思路和设计文档规范之下,是相对来说好处理的,这里的相对是指比较分布式架构下生产环境的突然故障。 在实际的开发中,有这样一个很妖娆的情况:越是核心复杂的业务,越是担心出问题,越容易出问题。 所以当核心服务的链路出现故障时,如何快速定位问题就是...

    文章 知了一笑 2020-09-17 337浏览量

  • 守护你的数据库:数据库容灾方案介绍(上)——阿里云 MVP张新铭

    【MVP时间】线上峰会,一键收藏 《数据库容灾方案介绍》精彩直播 以下是精彩视频内容整理,分享内容分为以下四个方面:1.数据库容灾的基本原理和方法;2.主流数据库容灾技术;3.数据库容灾体系中的陷阱;4.数据库容灾体系建设。 一、数据库容灾的基本原理和方法 二月底互联网界发生了一次比较严重的删库事...

    文章 云起君 2020-04-20 535浏览量

  • [数据恢复答疑]RAID真的安全吗?

    问题:     数据恢复既然是数据灾难的一种补救措施,那设计得绝对安全的RAID磁盘阵列系统也会出现数据灾难吗?为什么?在RAID数据恢复领域里常见的故障类型有哪些?   回答(北亚数据恢复中心张宇 [url]http://www.datahf.net[/url]):     RAID设计的初衷大...

    文章 余二五 2017-11-22 1126浏览量

  • 阿里:千亿交易背后的0故障发布

    前言 近几年,我们在发布效率和稳定性方面做了不少工作,其中效率简单的说就是发布耗时,一个是发布的速度,比如一个应用是1个小时发布完成,还是5分钟发布完成?另一个是人员介入,开发在发布过程中是否需要介入处理各种发布过程中出现的问题?这两者都做好了,才能说是发布效率提升了。稳定性最基础的是系统的稳定性...

    文章 阿里云头条 2018-04-20 4997浏览量

  • 无人值守时代,运维如何保障发布质量?

    导读:阿里巴巴千亿交易背后,如何尽量避免发布故障?在面对实际运维过程中遇到的问题该如何解决?近日,在GOPS大会上,阿里巴巴运维技术专家少荃,给我们带来了解决方案和思路。 作者:陆叶平(花名少荃),阿里巴巴研发效能事业部技术专家。目前从事运维中台(阿里内部叫诺曼底)建设方面的工作,是集...

    文章 云效平台 2018-04-18 3350浏览量

  • 遗留应用救星:VMware vMSC构建更灵活的数据中心

    大多数企业一直在寻求实现更高等级的应用及服务可用性。随着技术不断成熟以及客户服务成为我们日常生活中的一部分,人们希望在任何时间、任何地点都能够访问相应的应用与服务。 这一任务不是那么简单,因为必须要满足相应的服务级别协议(SLA)。SLA是IT部门与业务部门或企业与用户之间的一种度量方式。不同的S...

    文章 青衫无名 2017-08-01 1004浏览量

  • AI助力日志中心智能化运营

    摘要:AIOps将人工智能应用于运维领域,基于已有的运维数据通过机器学习的方式来进一步解决自动化运维无法解决的问题。运维数据包含海量的日志数据,随着大数据分析水平的提升,需要更加精准地挖掘日志当中的信息。本文将主要介绍日志易在AIOps方面如何做出智能的日志中心以及日志在IT领域中发挥的价值。 ...

    文章 sherlding 2018-06-23 9981浏览量

  • 阿里云马劲:保证云产品持续拥有稳定性的实践和思考

    对所有的技术人员来说,业务可靠性提升是一个系统工程,涉及网络管理、IDC管理、服务器管理、交付管理、变更管理、故障管理、监控管理、预案管理、根因分析、容量规划、容灾演练、标准化建设、集成测试、泛操作管理、权限管理、数据安全管理等方方面面,随着先进技术的应用、业务云化、微服务化等,业务架构变得更加复...

    文章 云攻略小攻 2018-12-06 15447浏览量

  • 【内含福利】专访阿里数据库备份专家 教你pick最有效的备份系统

    数据库备份是个老生常谈的话题,看似很简单,但在实际操作过程中,运维人员往往会遇到这样或那样的坑。 那么,如今的数据库备份有哪些挑战?如何构建有效备份系统?有什么解决办法?日前,小编就这些问题采访了阿里数据库备份专家衡铁刚(佩恩)。 阿里数据库备份专家衡铁刚(佩恩) 先问个小白问题:数据库为什么...

    文章 七幕 2018-08-10 2839浏览量

  • 打造应用全栈监控:ARMS 最佳实践

    ARMS作为业务的实时监控系统,可以帮助用户定位从前端到应用的普遍问题,以及利用全系排查解决单点问题定位。本文利用案例演示,更直观的为大家介绍ARMS是怎么帮助用户快速的定界和定位的。让天下没有难定位的问题是ARMS的最终愿景。 演讲嘉宾简介: 徐彤,阿里巴巴中间件技术家 阳其凯,阿里巴巴中间...

    文章 mongolguier 2018-05-31 1781浏览量

  • 智能化网络管理 为企业信息化保驾护航

         随着目前信息化突飞猛进的发展,科技改变了我们的生活,提高了我们工作的效率,甚至还能通过准确的数据分析帮助我们进行各类的管理。IT技术已经成为了我们工作和生活中不可缺少的重要工具。IBM公司曾经提出了“智慧地球”的远大目标,并受到美国总统奥巴马大力的赞赏,甚至将此概念作为美国在今后继续保持...

    文章 技术小美 2017-11-08 763浏览量

  • 日志易饶琛琳分享:AI 助力日志中心智能化运营

    摘要:AIOps 将人工智能应用于运维领域,基于已有的运维数据通过机器学习的方式来进一步解决自动化运维无法解决的问题。运维数据包含海量的日志数据,随着大数据分析水平的提升,需要更加精准地挖掘日志当中的信息。本文将主要介绍日志易在 AIOps 方面如何做出智能的日志中心以及日志在 IT 领域中发挥的...

    文章 日志易 2018-09-25 2021浏览量

  • 8分钟5个点让你彻底了解负载均衡

    负载均衡 负载均衡是高可用架构的一个关键组件,主要用来提高性能和可用性,通过负载均衡将流量分发到多个服务器,同时多服务器能够消除这部分的单点故障。当然负载均衡器本身就是一个单点故障隐患,可以考虑文章后面说的负载均衡双机热备或其他方案消除单点故障提高可用性。一个没有使用负载均衡的Web架构一般会长得...

    文章 Java架构师追风 2019-09-16 1020浏览量

  • “穿实验服的猴子”:Netflix的应用型故障测试研究

    在Qcon London 2016上,Peter Alvaro和Kolton Andrus分享了一项企业与学院合作的成功案例,这次合作最终为Netflix找到了一条自动化故障注入测试(failure injection testing)的崭新途径。在这一案例中他们收获了许多宝贵经验,其中主要包括:...

    文章 青衫无名 2017-07-03 1187浏览量

  • 如何轻松运维,你是救火队员还是工程师?

    特别是在企业里,如果不是在专门的互联网公司上班,很多企业it管理都是形同虚设,表面上是什么工程师,实际上就是一个救火队员,就简单的权限泛滥问题,几乎90%的公司都存在,尤其是在用linux系统时,root权限泛滥是普遍行为,造成这种现象的出现,我觉得最主要的一点就是中国it技术的落后,以及人对it...

    文章 技术小牛人 2017-11-12 865浏览量

  • 如何轻松运维,你是救火队员还是工程师?

    特别是在企业里,如果不是在专门的互联网公司上班,很多企业it管理都是形同虚设,表面上是什么工程师,实际上就是一个救火队员,就简单的权限泛滥问题,几乎90%的公司都存在,尤其是在用linux系统时,root权限泛滥是普遍行为,造成这种现象的出现,我觉得最主要的一点就是中国it技术的落后,以及人对it...

    文章 技术小牛人 2017-11-12 863浏览量

  • 日志系统的 AIOps 应用,及日志易智能日志中心运营之道

    本文将主要介绍日志在 IT 领域中发挥的价值,以及日志易在 AIOps 方面如何做出的智能日志中心。 以下内容根据日志易产品总监饶琛琳在 2018 云栖大会的演讲整理而成。小编看到这个有意思的分享,忍不住再次拿来翻新,以求和大家共同吸取其中的价值。 本次的分享主要围绕以下三个方面: 1.智能日志中...

    文章 技术小能手 2018-11-23 1588浏览量

  • 阿里双11网络技术揭秘:百万级物理和虚拟网络设备的智能化之路

    阿里巴巴资深技术专家后羿 后羿:大家好,首先给大家呈现的是阿里巴巴在双11中主要依赖的网络相关技术。在今年双11中我们在稳定性、高性能网关、去堆叠以及25G、骨干网流量调度平台、流量的精准评估、QOS优化和成本优化方面都取得了突破性的进展。 助力双11的重要网络技术 在稳定性的强化方面,在过去一年...

    文章 技术小能手 2018-01-05 4732浏览量

  • 企业购买云服务器之前应该考虑哪些因素

    企业公司购买云服务器需要考虑哪些问题?首选需要对自己的业务需求进行评估,同时心里要有大概的预算,业务需求和公司预算都是决定购买云服务器配置高低的主要原因。在选择云服务器商的时候应该考虑以下问题: 1.应考虑扩展性由于网络处于不断发展之中,快速增长的应用不断对服务器租用的性能提出新的要求,为了减少更...

    文章 上云活动指导 2019-08-01 1681浏览量

  • 基础设施助力双11(十):百万级物理和虚拟网络设备的智能化之路

    导言 后羿:阿里巴巴资深技术专家,参与8年双11大战,主导阿里“去IOE”战略落地,目前在推动阿里基础设施智能化。 后羿此次给大家分享的是双11的智能化网络实践,关于如何在网络智能领域通过数据手段极致地优化运营场景,在稳定性、成本、效率方面提升网络运营竞争力,给大家呈现了阿里巴巴在双11中主要依赖...

    文章 初商 2019-07-31 803浏览量

  • 阿里搜索事业部故障快速恢复实践

    这篇文章中,我们将讨论面对故障时,我们为什么选择快速切流这种机制。如果选择快速切流,我们需要具备哪些条件,需要切流平台解决什么样的问题。最后,我们畅想故障快速恢复未来如何做的更好。 一、关于故障的几种解决思路 如何定义故障 我们一般从以下几个维度来定义故障。一是影响的用户数量,例如用户投...

    文章 卢占一十力 2018-03-16 2364浏览量

  • 轻松应对双11,百万级物理和虚拟网络设备的网络智能化实践

    12月13-14日,由云栖社区与阿里巴巴技术协会共同主办的《2017阿里巴巴双11技术十二讲》顺利结束,集中为大家分享了2017双11背后的黑科技。本文是《双11的智能化网络实践》演讲整理,主要讲解了阿里巴巴在网络智能化技术中,大量级网络下网络变更、调度优化技术的大幅度提升,故障快速发现、定位、恢...

    文章 zengzengzeng 2017-12-14 1792浏览量

  • 解决虚拟机或物理机ping不通网关故障的方法与思路

    基本思路: 确定问题缩小范围。先外部后内部,利用排除法、类比法、替换法(隔离法)将故障范围逐渐缩小到某一点。 谨慎做出结论。下结论前先三思,想到所有可能存在问题的点,特别是与别人讨论和描述问题时更应该注意。 记录问题。做好文档备案工作,如记录故障现象、故障分析、故障原因、处理流程、处理...

    文章 技术小胖子 2017-11-07 1479浏览量

  • 通过事务日志解决SQL Server常见四大故障(一)

      同Oracle数据库一样,SQL Server数据库中也有事务日志。事务日志主要用来记录所有事务以及每个事务对数据库进行了哪些更改。事务日志可以说是数据库中最重要的数据文件之一。   当系统出现故障时,只要存在数据日志那么就可以利用它来恢复数据解决数据库故障。作为SQL Server数据库...

    文章 lzhdim 2009-03-26 721浏览量

  • 如何设计高可用系统之故障隔离

    作者:大谷 什么是故障 简单来说,当功能或性能不符合预期,就是故障。 故障有两个比较重要的衡量指标: RPO(Recovery Point Objective):主要指的是业务系统能容忍的最大数据丢失量,针对的是数据丢失。对于资金业务来说,一般 RPO 不能大于 0 的。 RTO(Recovery...

    文章 初商 2019-08-06 852浏览量

1 2 3 4 ... 34 >

云产品推荐

上海奇点人才服务相关的云产品 小程序定制 上海微企信息技术相关的云产品 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 自然场景识别相关的云产品 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT