• 走近华佗,解析自动化故障处理系统背后的秘密

    一方面完成飞天其他组件不擅长的OS和硬件的故障自动监测和处理,另一方面推动飞天去及时规避硬件和OS引起的故障,使得故障能够闭环运转,大幅度减少故障处理成本和造成的影响。飞天5K项目期间的规模效应凸显出自动化...
    文章 2016-12-18 4694浏览量
  • C++ 异常处理

    C++ 异常处理涉及到三个关键字:try、catch、throw。throw:使用 throw 关键字,当程序出现问题时会抛出一个异常。使用 throw 语句在代码块中的任何地方抛出异常。throw 语句的操作数可以是任意的表达式,表达式的...
    文章 2017-03-20 1876浏览量
  • 线上故障处理实践

    该系统从去年下半年开始一直偶尔有500的报错,但每次重启就好了,本次发生故障后,重启仍然是大量500;二、问题分析 先查看接入层日志,发现大量的500错误: 发现是连接应用接入层超时,应该是应用接入层压力大,...
    文章 2020-06-07 406浏览量
  • 深入探讨Java中的异常与错误处理

    Java中的异常处理机制已经比较成熟,我们的Java程序到处充满了异常的可能,如果对这些异常不做预先的处理,那么将来程序崩溃就无从调试,很难找到异常所在的位置。本文将探讨一下Java中异常与错误的处理方法,一起来...
    文章 2017-08-01 642浏览量
  • 年关将至,服务器被入侵了怎么办

    自行发现:根据服务器的异常故障判断,比如对外发送大规模流量或者系统负载异常高等,这种情况一般是运维工程师发现并核实的。二、现场保护(运维) 我们很多人看过大陆的电视剧《重案六组》,每次接到刑事案件,...
    文章 2017-05-15 2046浏览量
  • 连载:面向对象葵花宝典:思想、技巧与实践(18)-用...

    2)异常处理(Exception):在正常处理流程的步骤上,分析每一步的各种异常情况和对应的处理;3)替代处理(Alternative):在正常处理流程的步骤上,分析每一步是否有其它替代方法,以及替代方法如何做;经过这简单...
    文章 2014-03-17 1393浏览量
  • SQLServer灾难恢复

    打开SQLSERVER联机帮助文件,希望从中得到帮助,但是都没有符合我遇到的这个状况,因为我们的日志备份是晚上进行的,到发生故障时为止,没有经过一次备份。现在已经是21:30分,找到SQL的QQ群,向兄弟们求助,得到的...
    文章 2017-11-15 1133浏览量
  • 大数据存储:分布式系统的事务处理

    如果对A帐号的汇钱有两个并发操作(要汇给B和C),这两个操作发生在不同的两台服务器上怎么办?也就是说,在数据镜像中,在不同的服务器上对同一个数据的写操作怎么保证其一致性,保证数据不冲突?同时,我们还要考虑...
    文章 2017-08-01 814浏览量
  • 技术向:大数据存储—分布式系统的事务处理

    如果对A帐号的汇钱有两个并发操作(要汇给B和C),这两个操作发生在不同的两台服务器上怎么办?也就是说,在数据镜像中,在不同的服务器上对同一个数据的写操作怎么保证其一致性,保证数据不冲突?同时,我们还要考虑...
    文章 2017-08-01 989浏览量
  • 打造应用全栈监控:ARMS 最佳实践

    红色标注的是发生异常的节点信息,我们根据红色的信息很明显的发现接口的请求成功率下降是由于调用了RPC服务,然后是RPC服务底层出现了问题,而且还可以找到RPC服务的ip地址。也能找到它的端口。我们现在可以很明显...
    文章 2018-05-31 1959浏览量
  • 如何通过事务消息保障抢购业务的分布式一致性?

    一旦协调者发生故障&xff0c;参与者会一直阻塞下去&xff0c;整个系统将无法工作&xff0c;因此需要投入巨大的精力来保障事务协调者的高可用性。数据不一致问题。在阶段二中&xff0c;如果协调者向参与者发送commit请求之后&xff...
    文章 2021-02-24 2542浏览量
  • 音频开发中常见的四个错误

    如果UI中发生了一些异常&xff08;上方的蓝色线程&xff09;或者有网络操作&xff08;橙色线程&xff09;正在运行&xff0c;同时CPU也在渲染一些音频&xff0c;那么CPU 会丢弃所有内容使得有足够的算力服务于音频线程——这是CPU当前...
    文章 2021-03-17 100浏览量
  • 分布式基础,通俗易懂CAP?

    分布式系统,往往有多个节点,每个节点之间,都不是完全独立的,需要相互通信,当发生节点无法联通时,数据是否还能保持一致,系统要如何进行容错处理,是需要考虑的。同时,连通性和扩展性紧密相关,想要加机器扩展...
    文章 2019-08-08 502浏览量
  • 分布式基础,通俗易懂CAP?

    节点连通性,多节点扩展性,连通性异常处理必须保证,满足P●一致性C与可用性A一般二选一●选择一致性C,举例:传统单库水平切分,就是这类选型的典型●选择可用性A,举例:双主库同步高可用,就是这类选型的典型 ...
    文章 2018-10-31 1262浏览量
  • 如何做好一名稳定性SRE-业务团队系统稳定性的思与行

    举个例子:对于“问题”,传统的开发人员更多的倾向于是“bug/错误”,而SRE倾向于是一种“风险/故障”,所以,两者对“问题”的处理方法是不一样的: 开发:了解业务->定位问题->排查问题->解决问题 SRE:...
    文章 2020-10-26 4468浏览量
  • Redis学习总结-《我的Java打怪日记》

    分发器根据读、写、异常等情况进行分发给事件处理器&xff0c;事件处理器进而根据事件具体类型来调度相应的实现函数来完成任务。Reactor模式在Redis中的实现Redis处理客户端业务(文件事件)的基本流程&xff1a;Redis的IO...
    文章 2021-07-17 11216浏览量
  • OceanBase创始人阳振坤:什么是面向未来的数据库?

    但最近这些年情况发生了变化,原来由同一个关系数据库做的 OLTP 和 OLAP 这两件事情变成了由两个系统来做:关系数据库分库分表继续做在线交易处理,数据仓库则做商业智能分析即在线分析处理。为什么会出现这样的情况...
    文章 2019-11-27 821浏览量
  • OceanBase创始人阳振坤:什么是面向未来的数据库?

    但最近这些年情况发生了变化,原来由同一个关系数据库做的 OLTP 和 OLAP 这两件事情变成了由两个系统来做:关系数据库分库分表继续做在线交易处理,数据仓库则做商业智能分析即在线分析处理。为什么会出现这样的情况...
    文章 2019-11-29 1540浏览量
  • 带你读《SAS数据分析开发之道 软件质量的维度》第二章...

    以帮助我们处理异常情况&xff0c;提升软件的稳健性。支撑关键基础架构的软件 支撑数据分析架构关键组件的 ETL或其他 SAS软件就需要提升性能&xff0c;以避免出现系统、软件或合成数据产品不可用的风险。预定的软件 设定...
    文章 2021-10-20 7浏览量
  • 阿里集团搜索中台TisPlus

    也许有人会挑战说,异常概率并不高啊,偶尔处理下并没投入太多,但试想下我们的平台如果支持成百上千业务实例的时候,故障概率也就被成倍放大。其次很多时候运维管控操作是会出现反复,比如正在做全量任务流程中,...
    文章 2018-01-26 6755浏览量
  • Spring Cloud Alibaba 七天训练营(五)服务熔断和限...

    我们可以在浏览器反复请求 localhost:8090/demo/time(频率不要太慢),可以看到会出现限流异常信息(Dubbo provider 默认的限流处理逻辑是抛出异常,该异常信息由 Dubbo 直接返回,并由 Spring 展示为默认 error ...
    文章 2020-09-28 15918浏览量
  • 饿了么分布式服务治理及优化经验

    如果线上发生了一个故障,比如交换机发生故障,影响到某个业务,但是业务报警没有报出来,那业务要承担连带责任,因为你没有报警出来。报警最常见的基于阈值,阈值这件事情比较痛苦,我们有很多指标,但这个阈值怎么...
    文章 2017-11-15 895浏览量
  • 阿里云服务器购买前应该注意哪些事项?

    服务器可以防御5G的DDoS流量攻击,当出现网络攻击时,我们的监控系统可以自动检测到给您清洗异常流量,如果攻击很大的话,我们会给您做黑洞处理,保护您的服务器安全。九、如何选择操作系统?Windows:内含正版激活...
    文章 2019-12-18 3898浏览量
  • 阿里云表格存储技术分享

    从机房供电到机器散热、从网络拥塞到时钟异常、从操作系统bug到软件bug&xff0c;从硬盘故障到运维错误&xff0c;只有每一项都完美的配合才能做到这个进程持续可用&xff0c;实际上基本是不可能的。针对单进程可靠性不足的...
    文章 2016-05-28 6446浏览量
  • 一个复杂系统的拆分改造实践

    考虑以下非常简单的联表查询sql,如果将B表拆分到另一个库里的话,这个sql怎么办?毕竟跨库联表查询是不支持的!因此,在切库之前,需要将系统中上百个联表查询的sql改造完毕。如何改造呢?1)业务避免 业务上松耦合...
    文章 2017-01-04 7683浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    但是我们可以了解Uber的调度系统,怎样实行地理空间索引,怎样规划他们的系统,怎样实行高利用率和怎样处理失败,包括令人惊讶的方式处理数据中心故障,使用驱动的手机作为恢复外部分布式存储系统。在Matt的报告中,...
    文章 2017-11-20 1722浏览量
  • Uber首席系统架构师Matt Ranney:可伸缩的软件系统...

    但是我们可以了解Uber的调度系统,怎样实行地理空间索引,怎样规划他们的系统,怎样实行高利用率和怎样处理失败,包括令人惊讶的方式处理数据中心故障,使用驱动的手机作为恢复外部分布式存储系统。在Matt的报告中,...
    文章 2016-03-17 3520浏览量
  • HBase设计的实践经验(全)——《我的Java打怪日记》

    当某个 Region Server 发生 crash 时,它所管理的 region 就无法被访问了,直到 crash 被检测到,然后故障恢复完成,这些 region 才能恢复访问。Zookeeper 依靠心跳检测发现节点故障,然后 HMaster 会收到 region ...
    文章 2021-07-27 43063浏览量
  • 必须要理清的Java线程池(原创)

    但有一种情况,假设所有线程都在工作怎么办?这种情况下,SynchronousQueue就会新建一个线程来处理这个任务。所以为了保证不出现(线程数达到了maximumPoolSize而不能新建线程)的错误,使用这个类型队列的时候,...
    文章 2018-04-18 854浏览量
  • 论程序的健壮性——就看Redis

    2、故障处理:如果主服务器发生故障,Sentinel可以启动故障转移过程。把某台服务器升级为主服务器,并发出通知 3、配置管理:客户端连接到 Sentinel,获取当前的 Redis 主服务器的地址。我们不是直接去获取Redis主...
    文章 2020-09-16 861浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化