• 如何提高阿里云上应用的可用性(

    当程序员给喜欢的女孩子表白被拒绝了怎么办,一般可以做出万分痛苦状接一句“要不要再考虑一下”,这就是一种重试,在服务调用中,重试就是当对服务的调用出现异常或者错误时,自动的再次发起调用请求,可见这种...
    文章 2018-11-01 1938浏览量
  • 20 万网络节点背后的数据创新应用

    现在我们采用的方案是建设稳定的后,如果后端异常,以前积累的数据都是可以抛弃的,我们要保证后面的数据。数据落地存储之后,数据银行提供一个查询的API网关。刚才提到,对数据模型处理进行抽象。它的数据模型是...
    文章 2018-08-02 1077浏览量
  • 打造应用全栈监控:ARMS 最佳实践

    另外当接口出现问题,我们会把异常的信息打印出来,告诉你这时什么样的异常最多,异常里面的参数也打印出来。另外,阿里自己做了一个JVM的内存分析,在遇到内存泄露的问题时,ARMS帮助用户可以用很小的代价分析出...
    文章 2018-05-31 1951浏览量
  • 【云服务月刊】2018年第8期:阿里云MVP行走玄奘之路

    配置策略:客户策略为强制更新的客户,服务器策略为未修补。配置策略三:客户的策略为缓解,服务器策略为未修补具体可参考文档,点此查看。问:云呼叫中心是否支持400号码绑定?答:400号码实际上是一个...
    文章 2018-09-05 2772浏览量
  • AI赋能DevOps:数据驱动的全栈工程师实践

    OK,那网络端没有抖动,接下来怎么办,再去看用户的统计上有没有异常的一些抖动,结果发现,用户的统计上有抖动的话怎么办?我们再去下钻,去看什么类型的用户发生了抖动。比方说不同的城市有没有抖动,不同的接入点...
    文章 2019-11-04 9309浏览量
  • 【云服务月刊】2018年第2期:API Playbook 业界首发,...

    (b)客户到CDN节点的链路出现丢包建议尝试更换客户local dns为其他公共dns服务器测试访问。参考文档:【CDN 最佳实践】CDN访问异常排查思路CDN 的 HTTPS 相关问题及处理思路沙箱说明 弹性计算类问题 ECS-无法远程...
    文章 2018-03-01 6697浏览量
  • 阿里面试官:HTTP、HTTPS、TCP/IP、Socket通信、三次...

    我们需要从上图了解到的一点是,服务在SYN_RECEIVED状态下,接收到旧的SYN 报文时是不能作出判断的,而是照常返回,当客户接收到该报文后发现异常,才会发送RST 报文,重置连接。关于RST 报文,我一开始也很疑惑...
    文章 2020-01-16 2274浏览量
  • UC浏览器客户的数据监控及应用

    图3是某一个级接入点下面的一个指标,通过报表显示出最新版本数据出现了问题,发现了问题之后,怎么办呢?我们可能知道这个问题是影响性能的原因之一,但不敢确定是不是全部。如果没有更体系化的、更有力度的,多...
    文章 2015-12-13 7576浏览量
  • 【OSS 排查方案-7】ossimport 大数据量迁移方案总结

    四、如果出现的 FailTask 以后怎么办 ossimport 会对每个失败的文件有三次重试,如果依然失败,请在第一遍以后直接使用 bash console.sh retry 重试。配置分布式迁移文件 分布式迁移模式的数据体量都是大于 30TB,...
    文章 2018-04-20 13279浏览量
  • 看不见的战斗——阿里云护航世界杯直播容灾实践

    护航项目组负责人之一,阿里云CDN产品架构师团队喻义表示:在世界杯开始之前,团队就开始思考,直播中信号源出现故障怎么办,运营商网络出现故障怎么办以及其它意外等,项目组设想了各种可能出现的问题,并给出周密...
    文章 2018-07-11 2501浏览量
  • 如何健壮你的后服务?

    比如调用某第三方服务,报了个异常,有些同学就不管三七十一就直接重试,这样是不对的,比如有些业务返回的异常表示业务逻辑出错,那么你怎么重试结果都是异常;又如有些异常是接口处理超时异常,这个时候就需要...
    文章 2015-12-04 5477浏览量
  • 游戏运维编年史:可能是目前最详细游戏运维指南

    网络运维:层交换、三层交换、四层交换,还要区分华为、思科。业务运维:24点维护,零晨2点维护,零晨5点维护,早上7点维护…… 运维值班:0点盯着屏幕打电话,1点盯着屏幕打电话,2点盯着屏幕打电话…… 运维开发...
    文章 2017-05-02 3160浏览量
  • Linux系统被入侵后处理实战

    完成第步的操作后,奇迹出现了,执行ps –ef后,发下最下面有几行可疑程序。本想截图的,可惜SSH客户给关了,没留下截图。记忆中,大概是这样的: pid/sbin/java.log pid/usr/bin/dpkgd/ps –ef pid/usr/bin/...
    文章 2017-08-15 992浏览量
  • 明星讲师心石闪耀ArchSummit大会|手机淘宝构架演化...

    阶段,DAU的快速增长,WAP/Android/iOS多个平台的业务起来了,需要在多个平台上进行快速的业务复制和业务管控,统一API网关出现。第三阶段,DAU进一步增长,线上系统越来越多,业务的多样性需求更多的体现出来,...
    文章 2016-01-04 3177浏览量
  • Ossimport 大数据量迁移方案总结

    四、如果出现的 FailTask 以后怎么办 ossimport 会对每个失败的文件有三次重试,如果依然失败,请在第一遍以后直接使用 bash console.sh retry 重试。配置分布式迁移文件 分布式迁移模式的数据体量都是大于 30TB,...
    文章 2020-03-27 270浏览量
  • 支付宝智能化探索与实践|xMedia:多媒体智能应用...

    最后,为了保证用户体验,额外设置最大与最小帧率,以防止出现异常。我们通过下面这张图来看看该方法调节的效果,图分为上下两个部分,上半部分是 CPU 随时间变化的曲线,下半部分是算法输出的时间间隔随时间的变化...
    文章 2020-01-16 441浏览量
  • 支付宝智能化探索与实践|xMedia:多媒体智能应用...

    最后,为了保证用户体验,额外设置最大与最小帧率,以防止出现异常。我们通过下面这张图来看看该方法调节的效果,图分为上下两个部分,上半部分是 CPU 随时间变化的曲线,下半部分是算法输出的时间间隔随时间的变化...
    文章 2020-01-20 1911浏览量
  • RabbitMQ实战(三)-高级特性

    step5-如果出现意外情况,消费者未接收到或者 Listener 接收确认时发生网络闪断,导致生产的Listener就永远收不到这条消息的confirm应答了,也就是说这条消息的状态就一直为0了,这时候就需要用到我们的分布式定时...
    文章 2019-07-01 1831浏览量
  • 关于分布式锁的面试题都在这里了

    响应时间抖动很小,没有出现异常。但是随着并发量和业务数量的提升其响应时间和qps会明显下降。如何选择?(仅供参考,根据我个人经验) 提示 使用分布式锁,必须满足两个条件之一: 1.业务本身不要求强一致性,可以...
    文章 2020-04-26 991浏览量
  • 基于统一开发平台的微服务架构转型升级之路|某国有...

    微服务的测试与单体应用不同,前后、服务间都是Rest接口,如果A服务依赖了服务B,而服务B还没有开发完成怎么办?公司客户营销项目时,微服务之间有依赖关系,为了不受依赖服务的制约,在双方商定好Rest接口后,由...
    文章 2018-10-23 2622浏览量
  • 大众点评开源分布式监控平台 CAT 深度剖析

    、背景介绍 CAT整个产品研发是从2011年底开始的,当时正是大众点评App Net迁移Java的核心起步阶段。当初大众点评App已经有核心的基础中间件、RPC组件Pigeon、统一配置组件lion。整体Java迁移已经在服务化的路上。...
    文章 2016-11-15 2258浏览量
  • 创业公司快速搭建立体化监控之路(WOT2016)

    统一keepalive接口与接口处理时间统一上报的不足:上报异常说明系统一定异常,上报正常不能说明系统正常,例如:某个服务后的数据库挂了,此时这个服务的keepalive接口返回其实是正常的,接口的处理时间可能会比...
    文章 2019-08-12 611浏览量
  • Ossimport 大数据量迁移方案总结

    四、如果出现的 FailTask 以后怎么办 ossimport 会对每个失败的文件有三次重试,如果依然失败,请在第一遍以后直接使用 bash console.sh retry 重试。配置分布式迁移文件 分布式迁移模式的数据体量都是大于 30TB,...
    文章 2018-05-03 9323浏览量
  • 如何改变Redis用不好的误区

    但是,怕什么来什么,还是出了状况:主从Redis之间的网络出现了一点小动荡,想想这么大的一个东西在主从同步,一旦网络动荡了一下下,会怎么样呢?主从同步失败,同步失败,就直接开启全同步,于是200GB的Redis瞬间...
    文章 2017-12-20 5025浏览量
  • 学习分布式不得不会的ACP理论

    比如前几年支付宝光缆被挖断的事件,在网络出现故障的时候,支付宝就在可用性和数据一致性之间选择了数据一致性,用户感受到的是支付宝系统长时间宕机,但是其实背后是无数的工程师在恢复数据,保证数数据的一致性。...
    文章 2018-07-21 2295浏览量
  • 从JAVA多线程理解到集群分布式和网络设计的浅析

    那么问题了又出来了,小弟的问题是可以透明的看到了,要是那个老大出事了甚至于老总出事了怎么办?此时结合第一种思想,我们此时就只需要再老总下面挂一个跟班的,集合两种模式的特征,也就是小弟不需要配跟班的,...
    文章 2011-04-29 1904浏览量
  • 揭秘!双11万亿流量下的分布式缓存系统 Tair

    限流后,一部分流量会去访问数据库,那依然和刚刚所说的无法承受是一样的结果,整个系统出现异常。所以在这里,唯一的解决办法是缓存系统能够作为流量的终结点。不管是大促,还是热点新闻,还是业务自己的异常。缓存...
    文章 2018-02-28 9237浏览量
  • 【云服务月刊】2018年第3期:阿里云服务产品全新升级

    如果第步能连通,检查公网出口ip,应该设置的公网出口ip不对导致的,可参考。参考文档:RDS for MySQL 如何定位本地 IP RDS混访地址过期未释放 解决建议: 混访地址申请后,如果经典网络内网地址依然有流量的话,...
    文章 2018-04-09 4201浏览量
  • 线上故障如何快速排查?来看这套技巧大全

    3.2 慢SQL3.2.1 问题出现应用TPS下降,并出现SQL执行超时异常或者出现了类似如下的告警信息,则常常意味着出现了慢SQL。3.2.2 问题分析分析执行计划:利用explain指令获得该SQL语句的执行计划,根据该执行计划,可能...
    文章 2020-11-10 3957浏览量
  • SpringCloud实战3-Hystrix请求熔断与服务降级

    对于查询操作,我们可以实现一个fallback方法,当请求后服务出现异常的时候,可以使用fallback方法返回的值.fallback方法的返回值一般是设置的默认值或者来自缓存.通知后面的请求告知这服务暂时不可用了。使得应用...
    文章 2018-05-12 1478浏览量
1 2 3 4 6 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化