• 666IDC高防服务器 全年24小时30秒售后回复 有问题找我

    排除上联网络设备异常导致的误报,包括机房断网演练,小面积网络故障,上联网络故障,如通过探测丢包情况,使用一些逻辑初步判断网络问题。服务器本身未丢包的误报,除了需要过滤出网络问题,还要通过丢包数据分析,...
    文章 2020-05-14 495浏览量
  • 中国证实互联网故障源于根服务器遭攻击

    经对已掌握的数据进行分析,初步判断此次事件是由于网络攻击导致我国境内互联网用户通过国际顶级域名服务解析时出现异常,攻击来源 正在进一步调查中。根服务器主要用来管理互联网的主目录,全世界只有13台。其中大...
    文章 2017-06-03 1895浏览量
  • 如何提高阿里云上应用的可用性(二)

    当程序员给喜欢的女孩子表白被拒绝了怎么办,一般可以做出万分痛苦状接一句“要不要再考虑一下”,这就是一种重试,在服务调用中,重试就是当对服务端的调用出现异常或者错误时,自动的再次发起调用请求,可见这种...
    文章 2018-11-01 1965浏览量
  • 阿里云网络双十一的定海神针-智能网络平台齐天

    网络当中故障随时可能会发生,一台设备的故障,一根线路的异常,甚至一个端口的问题,都有可能导致网络故障的发生,而一旦网络发生故障,引起的蝴蝶效应则是大面积的上层业务和应用出现问题。很明显,双11期间我们是...
    文章 2019-11-20 3100浏览量
  • 清华裴丹分享AIOps落地路线图,看智能运维如何落地...

    因此,现实中的异常检测实践中经常出现的情形是,上周出现了漏报误报,那我本周就调整一下阈值,但是根据这一个个case来决定静态阈值的话,容易丢西瓜捡芝麻,导致出现新的、可能是更严重的误报漏报。还有,以往有...
    文章 2017-11-24 8836浏览量
  • 走近华佗,解析自动化故障处理系统背后的秘密

    例如一个交换机的网络故障(半坏不坏),可能就会引起大批量的任务失败,但调查失败的根本原因可能要翻遍整个系统才知道是网络故障。更重要的是单集群的规模增大之后,人为处理故障过程中可能出错的概率更大,并且...
    文章 2016-12-18 4724浏览量
  • 看不见的战斗——阿里云护航世界杯直播容灾实践

    护航项目组负责人之一,阿里云CDN产品架构师团队喻义表示:在世界杯开始之前,团队就开始思考,直播中信号源出现故障怎么办,运营商网络出现故障怎么办以及其它意外等,项目组设想了各种可能出现的问题,并给出周密...
    文章 2018-07-11 2518浏览量
  • 对系统故障处理的思考

    根据多年系统的故障来看,60%都是人为造成的,40%才是系统自身产生的故障,在系统产生的故障中大部分都是业务逻辑、sql性能引起的,还有一小部分是网络、硬件引起的。sql性能方面的主要有以下:1.没有使用正确的索引...
    文章 2017-11-14 944浏览量
  • 难以置信,MySQL也可以无损自由切换

    如前所述,当主库准备提交事务之后,先将事务写入本机binlog,然后在将其传送给备库之前,此时主库故障或网络故障,主库上就会有更多的binlog。我们注意到,此时这些事务并未在存储引擎层提交,也尚未返回给客户事务...
    文章 2018-06-16 5035浏览量
  • 打造应用全栈监控:ARMS 最佳实践

    另外当接口出现问题,我们会把异常的信息打印出来,告诉你这时什么样的异常最多,异常里面的参数也打印出来。另外,阿里自己做了一个JVM的内存分析,在遇到内存泄露的问题时,ARMS帮助用户可以用很小的代价分析出...
    文章 2018-05-31 1969浏览量
  • 如何健壮你的后端服务?

    在需求分析阶段,单一职责原则可以界定我们服务的边界,如果服务边界如果没界定清楚,各种合理的不合理的需求都接,最后导致服务出现不可维护、不可扩展、故障不断的悲哀结局。对于架构来讲,单一职责也非常重要。...
    文章 2015-12-04 5508浏览量
  • “SDN分析”是开启未来智能网络大门的钥匙

    某个网络部件出现故障后如何快速做出反应?假如软件或者硬件升级导致异常甚或其他连锁反应怎么办?在管理控制台中敲几个策略不太可能解决这些问题。解决任何计算问题的关键是理解可用数据代表的意义。网络日志和操作...
    文章 2017-07-03 934浏览量
  • “SDN分析”是开启未来智能网络大门的钥匙

    某个网络部件出现故障后如何快速做出反应?假如软件或者硬件升级导致异常甚或其他连锁反应怎么办?在管理控制台中敲几个策略不太可能解决这些问题。解决任何计算问题的关键是理解可用数据代表的意义。网络日志和操作...
    文章 2017-08-01 751浏览量
  • 一场足球盛宴的终结:日帐延迟寻因记

    通过一轮咨询,各组成员都反馈尚未发现异常怎么办?都没异常,那日账为何会突然延迟呢?此时球兜了一圈又回到了咱们dba手上。此刻要冷静,再回首缕一缕。从剖析日志及各组反馈的结果综合看来,问题肯定来自redo ...
    文章 2017-05-02 1104浏览量
  • AI赋能DevOps:数据驱动的全栈工程师实践

    OK,那网络端没有抖动,接下来怎么办,再去看用户的统计上有没有异常的一些抖动,结果发现,用户的统计上有抖动的话怎么办?我们再去下钻,去看什么类型的用户发生了抖动。比方说不同的城市有没有抖动,不同的接入点...
    文章 2019-11-04 9385浏览量
  • 双11幕后超级英雄:新一代运维的价值

    整理出当天可能出现异常情况,提前预演。去年天猫双十一开场仅仅十分钟,世界支付纪录被再次刷新。支付宝公布的数据显示,在零点 9 分 39 秒,支付宝的支付峰值达到 12 万笔/秒,是前年的 1.4 倍,刷新了去年创下...
    文章 2017-11-15 4731浏览量
  • 20 万网络节点背后的数据创新应用

    26分的时候反馈温度异常原因是空调故障,需要几个小时的恢复时间。来看一下我们的业务监控。6月21分业务视图告警通知到业务运维同学,6点30分,在10分钟之内把相关业务的运维同学召集起来,启动了大范围故障处理流程...
    文章 2018-08-02 1078浏览量
  • 为什么说传统分布式事务不再适用于微服务架构

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用性一般是更好的选择,但是在服务和数据库之间维护数据一致性是非常根本的需求,微服务架构中应...
    文章 2017-07-03 1583浏览量
  • 分布式事务一致性"看这一篇就够了

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用性一般是更好的选择,但是在服务和数据库之间维护数据一致性是非常根本的需求,微服务架构中应...
    文章 2018-04-17 10623浏览量
  • 为什么说传统分布式事务不再适用于微服务架构?

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用性一般是更好的选择,但是在服务和数据库之间维护数据一致性是非常根本的需求,微服务架构中应...
    文章 2017-08-01 1309浏览量
  • 微服务架构下的事务一致性保证

    这可能持续一个不确定的时间,尤其是在系统已经表现出高延迟时或者网络故障导致失去连接时。依据目前的成功经验,可用性一般是更好的选择,但是在服务和数据库之间维护数据一致性是非常根本的需求,微服务架构中应...
    文章 2016-12-09 18075浏览量
  • 年关将至,服务器被入侵了怎么办

    将iptables-L敲成iptables-i导致iptables-save时出现异常记录,结果安全人员上来检查时就被这条记录迷惑了,导致处理思路受到一定干扰。1、所有用户History日志检测 关键字:wget/curl,gcc,或者隐藏文件,敏感文件...
    文章 2017-05-15 2056浏览量
  • Oracle Data Recovery Advisor(DRA)数据恢复顾问

    另一个是运行过程障碍,例如运行中数据库异常损坏(如数据文件被后台删除)。 目前DRA可以支持User界面和命令行两种方式工作。在OEM中,我们点击修复链接,查看或者直接解决问题。在命令行中,我们可以...
    文章 2017-07-24 2303浏览量
  • 【OSS 排查方案-7】ossimport 大数据量迁移方案总结

    四、如果出现的 FailTask 以后怎么办 ossimport 会对每个失败的文件有三次重试,如果依然失败,请在第一遍以后直接使用 bash console.sh retry 重试。配置分布式迁移文件 分布式迁移模式的数据体量都是大于 30TB,...
    文章 2018-04-20 13318浏览量
  • 学习分布式不得不会的ACP理论

    对于多数大型互联网应用的场景,主机众多、部署分散,而且现在的集群规模越来越大,所以节点故障、网络故障是常态,而且要保证服务可用性达到N个9,即保证P和A,舍弃C(退而求其次保证最终一致性)。虽然某些地方会...
    文章 2018-07-21 2301浏览量
  • SQLServer灾难恢复

    然后小管进行了简单的测试:Ping数据库服务器没有问题,证明网络连接没有问题。ODBC连接也可以连接到数据库服务器的MASTER数据库,证明客户端没有问题。问题出在CMS应用数据库上。现在小管还没有认识到问题的严重性...
    文章 2017-11-15 1147浏览量
  • 上云之网络搬站

    IDC内部网络肯定是有冗余的,防止某个设备出现异常导致单点故障,同时对外的出口在一个数据中心往往有一个或多个,规模大一些的IDC会同时接入多家运营商,保证和对端的通信质量。在传统的IDC内部署业务时,往往是在...
    文章 2019-07-03 1029浏览量
  • 调度策略的测试方法及其自动化

    除此之外,我们还需要关注各模块有没有出现异常报警,这里所谓的异常报警,包括本身正常但不应该于此时出现的报警。【本文首发于:百度测试技术空间】...
    文章 2017-11-23 953浏览量
  • 企业要如何防御恶意 bot 流量?

    在学习过程中,有异常数据混入怎么办?其实这并不影响基线数据的建立,基线最终的阈值可以使用数学方法进行去除异常点。正常的东西总是很相近,但是异常的东西之间存在很大差异,模型基线的建立是允许有噪音数据的。...
    文章 2017-09-14 1905浏览量
  • Linux 系统运维自动化概述

    故障出现之前,管理人员应该能在任何时间,任何地点接收到告警信息,并及时处理问题,把故障隐患扼杀在摇篮中。(强大的监控与报警机制) 2.事中恢复 即使是再完美的运维方案,也可能有预料之外的故障。为保证在最...
    文章 2017-11-14 1313浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化