• 666IDC高防服务器 全年24小时30秒售后回复 有问题找我

    排除上联网络设备异常导致的误报,包括机房断网演练,小面积网络故障,上联网络故障,如通过探测丢包情况,使用一些逻辑初步判断网络问题。服务器本身未丢包的误报,除了需要过滤出网络问题,还要通过丢包数据分析,...
    文章 2020-05-14 493浏览量
  • CPU静默数据错误:存储系统数据不丢不错的设计思考

    但是在数据不丢也不错时,也不一定保证数据一致性,因为在业务逻辑设计中并没有满足一致性要求,例如数据库事务ACID的一致性要求,通常是逻辑上的数据正确性。本文重点讨论数据的不丢不错故障原因,以及数据存储系统...
    文章 2021-07-01 3045浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    通过业务监控的多维下钻功能,查看交易的错误码详情可以发现“超时错误码”大量增加,可以排除业务逻辑类问题。继续从业务监控下钻到应用监控,根据订单指标对应的调用链路发现,某下单应用的数据库调用成功率大幅...
    文章 2021-07-06 240浏览量
  • “穿实验服的猴子”:Netflix的应用型故障测试研究

    因此,如果一套系统,可预见的故障场景多达种,那么这套系统就必须在满足业务逻辑的基础上,兼顾每种故障场景下的替代路径。测试数量的指数级增长,意味着必须有自动化的实施方案,然而这并非易事。一种简单的策略是...
    文章 2017-07-03 1269浏览量
  • 一文告诉你什么是 Serverless 工作流?

    方便您快速识别故障位置,并快速排除故障问题。支持长时间运行流程Serverless 工作流可以跟踪整个流程,持续长时间执行确保流程执行完成。有些流程可能要执行几个小时、几天、甚至几个月。例如运维相关的 Pipeline ...
    文章 2020-04-16 866浏览量
  • 阿里云Redis助力新东方乐词业务快速稳定发展

    阿里云技术团队也给我们的开发团队提供了有力的技术支撑,碰到技术问题,我们可以非常及时得到响应,帮助我们排除业务开发中的许多问题,再次证明我们的当初选择是正确的。展望未来,随着业务的扩展,我们的数据会...
    文章 2018-09-07 1486浏览量
  • golang 服务大量 CLOSE_WAIT 故障排查

    发现代码中有一个方法有问题,这个方法之前一直没有业务规则命中,故障前一天26号有一个业务方开始走到这个方法。这个方法有一个隐藏bug,会导致 go 连接无法关闭。这个bug其实也有go.sql原生库的一半责任。var r*...
    文章 2020-01-26 1104浏览量
  • Design7:数据删除设计

    只需要到History表找到相应的数据,将其重新插入到Prodcut 表中,并且,History 表中不仅可以存储用户删除操作的历史记录,而且可以存储用户更新的历史记录,对于系统的维护,解决用户纠纷和故障排除,十分有帮助。...
    文章 2016-09-16 854浏览量
  • 如何设计可靠的灰度方案

    最终,全部用户被纳入到新逻辑的范围内,此时需要决定是否将灰度逻辑本身和系统中的老业务逻辑同步下线,全部用户仅可以使用新逻辑,此时即灰度完成。也有由于历史数据原因,长期无法完成全量灰度切换的,此时业务...
    文章 2021-08-20 289浏览量
  • 双11 背后的全链路可观测性:阿里巴巴鹰眼在“云原生...

    团队对集团内的历年故障做了一次仔细梳理,集团内的核心应用通常有四类故障(非业务自身逻辑问题):资源类、流量类、时延类、错误类。再往下细分: 资源类:比如 cpu、load、mem、线程数、连接池;流量类:业务流量跌...
    文章 2019-12-20 1043浏览量
  • 如何提高微服务架构的可用性

    当某个微服务发生故障时,如何确保不会导致其他依赖的微服务不可用,如何确保系统自动降级把发生故障的微服务排除出去,如何确保故障不会扩展到整个系统?那么如何有效确保微服务架构的可用性将会成为挑战。下图是...
    文章 2016-08-08 6012浏览量
  • 云原生网络代理 MOSN 透明劫持技术解读

    降低劫持规则的管理成本,使得 Service Mesh 的引入不会造成额外的负担,在落地过程中,可以更加专注在业务逻辑上,能够充分满足多语言,多环境下的服务治理需求。如果大家对 MOSN 有问题以及建议,欢迎与我们交流,...
    文章 2020-05-22 306浏览量
  • IT运营是IT运维的下一个出口?

    最初,为保证IT系统的正常运维,大多数企业被动地进行故障排除以及软硬件的维护。而如今,越来越多的企业主动的进行IT运营维护服务,对系统进行运营管理,未雨绸缪,防患于未然。伴随云计算、大数据等热门技术的发展...
    文章 2017-09-01 1194浏览量
  • 浅谈云原生架构的 7 个原则

    监控数据的呈现形式应该不仅仅是指标趋势图表、柱状图等,还需要结合复杂的实际应用场景需要,让视图具备下钻分析和定制能力,以满足运维监控、版本发布管理、故障排除等多场景需求。​随着云原生技术的发展,基于...
    文章 2021-08-13 45浏览量
  • 5 个快速的 Node.js 应用性能提示

    接下来,观察你的产品故障排除模式,然后判断 AppDynamics 捕获的进程快照数在你当前状况下是否合适。如果你发现每分钟捕获 2 个快照太多了,那么你可以配置 AppDynamics 来调整快照间隔。尝试配置 AppDynamics 让...
    文章 2017-08-01 1058浏览量
  • 云计算网络基础架构的实践和演进——打造云计算网络...

    通过Overlay逻辑网关去组织业务进行资源编排就可以构建出非常丰富的基于Overlay网络的产品。二、云计算网络的可靠性和故障定界 前面主要介绍了云计算网络的一些基础概念,接下来将会针对云计算网络的可靠性以及故障...
    文章 2017-04-24 18752浏览量
  • 5 个快速的 Node.js 应用性能提示

    接下来,观察你的产品故障排除模式,然后判断 AppDynamics 捕获的进程快照数在你当前状况下是否合适。如果你发现每分钟捕获 2 个快照太多了,那么你可以配置 AppDynamics 来调整快照间隔。尝试配置 AppDynamics 让其...
    文章 2017-06-05 1074浏览量
  • 浅谈云原生架构的 7 个原则

    监控数据的呈现形式应该不仅仅是指标趋势图表、柱状图等,还需要结合复杂的实际应用场景需要,让视图具备下钻分析和定制能力,以满足运维监控、版本发布管理、故障排除等多场景需求。​随着云原生技术的发展,基于...
    文章 2021-07-16 7456浏览量
  • 带你读《思科软件定义访问:实现基于业务意图的园区...

    并简化网络的部署、故障排除和管理。DNA中心提供规范的局域网自动化服务&xff0c;可以根据思科验证的最佳设计实践来实现自动发现、配置和部署网络设备。一旦网络设备被发现&xff0c;自动底层网络资源调配利用即插即用&...
    文章 2021-10-19 3浏览量
  • 微服务治理实践:如何对单点异常进行自动摘除

    对应用的伤害未免过大,但如果我们可以检测出服务集群中某些故障机子,并对其进行短暂隔离,即可有效保障服务的高可用与系统的稳定性,同时给运维人员提供了宝贵的缓冲时间,用于问题定位,排除故障。本文将作为《微...
    文章 2019-12-16 2604浏览量
  • 一次线上JVM问题的排查——一把无人持有的锁

    代码问题指的是业务代码本身逻辑问题把JVM带入了某种故障状态。问题的分析及排除很简单,通过观察应用日志即可。3.2 现场捕获 定位了问题,问题也就解决了一半。一般来说,定位问题主要有两个分类,即时定位,事后...
    文章 2020-06-02 550浏览量
  • 饿了么交付中心语言栈转型总结

    针对灰度梯度合理制定,根据业务特征,开始阶段我们选择了较冷门城市(订单量较低)进行了各个运力标品业务逻辑验证。标品验证完后说明我们新迁移实现的逻辑和原系统具有一致性。随后我们拉取了当前订单城市分布,...
    文章 2019-11-08 2448浏览量
  • 阿里千亿级流量移动API网关的演进之路

    通过在服务端和客户端两方面去把公共的一些设施下沉下来以后,对研发效率效率会有一个很大的改变,因为所有的业务只需要关注于业务逻辑本身的开发。服务的开发模式也不会像以前一样乱。随着互联网的慢慢成熟,淘宝有...
    文章 2018-05-26 5738浏览量
  • 如何将bug杀死在摇篮里?

    第三层测试用例逻辑层,该层主要是将服务层封装好的各个业务对象,组织成测试逻辑,进行校验。第四层测试场景,将测试用例组织成测试场景,实现各种级别cases的管理、冒烟,回归等测试场景。测试执行随着测试用例的...
    文章 2017-06-29 2357浏览量
  • 网络拓扑手工绘制不可或缺

    手工绘制逻辑拓扑图之所以作为自动发现网络拓扑的补充,因为自动发现网络拓扑的时候,也有发现不准或者发现不到的时候,而且逻辑拓扑图是自动拓扑发现所不能实现的。更多相关信息,请点击[url]...
    文章 2017-11-25 1110浏览量
  • VMware SDS 之四:VSAN的技术细节

    存储供应商可以使用VASA为vSphere提供有关特定磁盘阵列的信息,包括磁盘阵列功能特性(例如快照、重复数据删除、复制状态、RAID级别、以及是精简置备还是厚置备)和状态(容量、运行状况、故障排除等)等信息。...
    文章 2017-11-15 1497浏览量
  • 软件质量没有银弹:阿里巴巴的25个技术实践与坑

    第三层测试用例逻辑层,该层主要是将服务层封装好的各个业务对象,组织成测试逻辑,进行校验。第四层测试场景,将测试用例组织成测试场景,实现各种级别cases的管理、冒烟,回归等测试场景。测试执行 随着测试用例的...
    文章 2017-06-27 11316浏览量
  • 阿里创新自动化测试工具平台-Doom

    目前阿里内部几乎所有交易核心系统都通过doom去做引流回归测试,没有发生过一起因doom使用过程中导致的业务故障。影响可控 只需要线上少数几台机器开启流量录制,流量的录制也支持按百分比去采样,因此即便发生问题...
    文章 2017-12-05 30924浏览量
  • 《一起学sentinel》四、Slot的子类及实现之LogSlot和...

    1.在entry阶段这个slot没有什么业务逻辑,主要就是拦截了业务异常和Throwable级别的错误 2.如果是com.alibaba.csp.sentinel.slots.block.BlockException的异常,则将异常信息用LogSlot专用的EagleEyeLogUtil记录。3....
    文章 2020-09-25 195浏览量
  • 函数组合的N种方式

    可视化监控:FnF 提供了可视化界面来协助定义流程和查看执行状态,方便您快速识别故障位置,并快速排除故障问题。运维全托管和按需付费:FnF 让您从基础设施维护中解放出来,提供了安全的、高可用的、高容错的弹性...
    文章 2019-10-25 1444浏览量
1 2 3 4 ... 7 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化