• 线上问题如何排查处理?这篇全搞定|开发者社区精选...

    线上常见问题排查手册本文从线上实际问题和故障的排查出发,分享如何快速定位和恢复线上常见问题和故障,总结了很多实操的方法,希望对大家有用。gt;gt;戳我前往了解全文救火必备!问题排查与系统优化手册软件工程...
    文章 2021-08-02 133浏览量
  • 展望下一代医疗集成平台

    集成平台承载了医院的核心业务,因而从保障业务连续性角度必须做到有“备”而无患,常见的解决方案有双机冷备和双机热备。总体说来,双机即两台服务器,一台主机(Master)运行(Active),一台备用(Slave)机待命...
    文章 2020-06-23 411浏览量
  • 应用及业务高可用提升工具平台之故障演练

    丰富的故障场景丰富的故障场景也是AHAS Chaos的一大特色,包括以下场景:常见的基础设施资源例如CPU、内存、磁盘等。应用级别的故障注入,目前支持Java应用,后续将陆续推出对于NodeJs和C++的应用故障注入。云原生...
    文章 2020-07-06 2558浏览量
  • 在 Ali Kubernetes 系统中,我们这样实践混沌工程

    整体来说,混沌是一种故障注入规则,强调了一些不确定性、随机性,比较常见的"猴子"有 Netflix 的"猴子军团",可以用来随机关闭系统实例,注入延时,回收资源,检查安全漏洞等等。开源工具介绍 除了一般系统的 ...
    文章 2019-03-13 2779浏览量
  • 《测试反模式:有效规避常见的92种测试陷阱》—— 2.2...

    65.系统测试作为集成测试(TTS-INT-4)测试人员在应该执行测试组件接口和交互的集成测试时,但实际却执行了系统功能的系统级测试。2.2.3 专业工程测试陷阱下面的陷阱在本质上高度相似,但是它们在细节上差别显著。...
    文章 2017-07-03 1166浏览量
  • 鲜为人知的混沌工程,到底哪里好?

    对于单机或同机型的故障,以系统为视角,故障可能是当前进程内的故障,比如:如FullGC,CPU飙高;进程外的故障,比如其他进程突然抢占了内存,导致当前系统异常等。同时,还可能有一类故障,是人为失误,或流程失当...
    文章 2019-01-29 3153浏览量
  • 阿里巴巴在混沌工程领域的实践和思考

    故障演练(MonkeyKing):是阿里巴巴在混沌工程领域的产品,目标是沉淀通用的故障模式,以可控成本在线上重放,以持续性的演练和回归方式运营来暴露问题,不断推动系统、工具、流程、人员能力的不断前进。...
    文章 2018-12-19 3250浏览量
  • 当 Messaging 遇上 Jepsen

    另一个方式是通过测试来验证,但普通的单元测试和集成测试无法覆盖到一些只有在高并发或者故障发生时才会出现的边缘情况,这些给分布式系统测试带来了新的挑战。混沌工程的出现带来了新的验证思路,企业需要在测试...
    文章 2019-11-22 4955浏览量
  • 微服务架构的基础设施

    从整体上来看,系统中某个微服务出故障的概率会大大增加,如果不及时处理故障故障扩散开来就会导致看起来系统中很多服务节点都故障了,因此需要微服务能够自动应对这种出错场景,及时进行处理。否则,如果节点一...
    文章 2020-06-01 469浏览量
  • 企业级集成和ESB

    SOA-面向服务架构,实际上强调的是软件的一种架构,一种支撑软件运行的相对稳定的结构,表面含义如此,其实SOA是一种通过服务整合来解决系统集成的一种思想。不是具体的技术,本质上是一种策略、思想。ESB-企业服务...
    文章 2016-05-03 3402浏览量
  • 阿里云马劲:保证云产品持续拥有稳定性的实践和思考

    对所有的技术人员来说,业务可靠性提升是一个系统工程,涉及网络管理、IDC管理、服务器管理、交付管理、变更管理、故障管理、监控管理、预案管理、根因分析、容量规划、容灾演练、标准化建设、集成测试、泛操作管理...
    文章 2018-12-06 15711浏览量
  • 企业级集成和ESB

    SOA-面向服务架构,实际上强调的是软件的一种架构,一种支撑软件运行的相对稳定的结构,表面含义如此,其实SOA是一种通过服务整合来解决系统集成的一种思想。不是具体的技术,本质上是一种策略、思想。ESB-企业服务...
    文章 2011-11-03 785浏览量
  • 超全总结|阿里如何应对电商故障?神秘演练细节曝光

    分布式系统常见依赖故障治理及技术演进 首先抛一个问题,什么情况下你会认为淘宝网挂了?我相信关注这个问题的人很多,不过能给出确切答案的人并不多。因为这个看似简单的问题,真要回答起来好像也不是那么容易。...
    文章 2017-06-19 3724浏览量
  • 独家下载|《大数据工程师必读手册》揭秘阿里如何玩转...

    系统的监控运维告警可以帮助企业快速发现系统故障,定位故障和处理故障,对企业业务稳定性起到至关重要的作用。业务监控系统可以实时进行业务告警,进行业务趋势的分析和判断,对于数据化运营起到重要的帮助。中国...
    文章 2019-11-18 1084浏览量
  • 制造业如何应用人工智能?

    创建数字孪生的过程,集成了人工智能、机器学习和传感器数据,以建立一个可以实时更新的、现场感极强的“真实”模型,用来支撑物理产品生命周期各项活动的决策。在完成对数字孪生对象的降阶建模方面,可以把复杂性和...
    文章 2021-09-13 40浏览量
  • 阿里巴巴DevOps实践指南(二十一)|全景监控

    通过对阿里巴巴历年故障的仔细梳理,阿里巴巴集团内的核心业务的常见故障(非业务自身逻辑问题)都可以通过流量、时延、错误等 3 类指标反应出来,我们称之为黄金指标:流量:业务流量跌零 OR 不正常大幅度上涨下跌...
    文章 2021-07-06 240浏览量
  • 软件测试技术-系统测试

    该测试在分布式系统中比较常见 因为使用分布式系统的软件要运行在多个不同的计算机上 为了实现不同的计算机之间互相通信,这些计算机需要遵守一些协议 但是因为协议是自然语言规定的,每个人对其理解都有可能不一样 ...
    文章 2014-07-18 695浏览量
  • 企业Web应用中的敏捷测试和瀑布测试

    1、要能自动化执行,并且进入持续构建(如果测试运行时间很多长,也可以只在开发持续构建中包含一小部分精挑细选的功能测试,而在系统集成持续构建中包含全部功能测试)。2、在编码之前写下测试意图,代码完成后对...
    文章 2017-07-10 1426浏览量
  • Infortrend服务管理器与服务网站新升级,让存储系统的...

    并且,其他问题(例如系统故障)能够快速有效的解决。用户也可以选择通过服务管理器,手动申请服务,查看申请历史,追踪进度等。Infortrend官网中的技术支持网站得到大幅度改版,将所有功能对应的服务与支持全部整合...
    文章 2017-11-01 1039浏览量
  • 基于机器学习的内存故障预测了解一下|双11备战

    内存(DRAM)故障常见的计算机硬件故障之一。在现在的大规模数据中心中,常常有内存故障导致的宕机事件出现。为了降低非预期的宕机率,预测潜在的内存故障是重要手段之一。本文通过对服务器日志的分析,综合服务器...
    文章 2019-07-31 1652浏览量
  • 《云计算:原理与范式》一3.8 SaaS集成产品和平台

    到现在为止,企业内部用其他按需应用和系统集成force.com应用,似乎是一项艰巨而强悍的任务,它需要太多时间、金钱和专业知识。Jitterbit是一个完全图形化的集成解决方案,它为用户提供了一个通用平台和生产力工具套...
    文章 2017-08-01 1408浏览量
  • 如何提高阿里云上应用的可用性(二)

    这一专门的领域称之为Chaos engineering,在阿里内部,通过故障演练平台,每天都在进行着各种类型的故障演练,这些故障包括操作系统层面的故障如进程意外退出,CPU内存飚高,也包括网络层面的故障如网络延迟丢包,...
    文章 2018-11-01 1945浏览量
  • 基于交付用户满意产品的质量体系

    在同类产品满意度调查问卷常见的问题中发现&xff0c;出现频率比较多的几个问题包括&xff1a;系统可操作性&xff0c;系统对业务的帮助&xff0c;系统稳定性&xff0c;对培训是否满意&xff0c;问题处理速度&xff0c;需要优化的模块&xff0...
    文章 2021-07-22 169浏览量
  • 云原生高可用技术体系的构建

    2.企业引入故障演练遇到的常见问题 在企业进行故障演练的时候,经常会遇到一些问题,比如如何设计组织架构,如何选择技术方案,如何落地演练实践等。如果业务牵涉到资金,就要做一个清晰化的深层评估,不要因为演练...
    文章 2020-07-20 1126浏览量
  • Riverbed发布业界最全面的数字体验管理解决方案

    此外,SteelCentral Aternity与AppInternals之间的集成工作流程为整个终端用户服务提供了一个集成监测系统,使得IT部门能够跨设备和应用为业务关键型应用快速排除故障。这将为包括终端用户服务、应用程序开发和运营...
    文章 2017-10-03 962浏览量
  • 安全管理最佳实践系列:阿里云Access Key的轮转

    如果你担心密钥轮转会导致系统故障,那么就将密钥轮转尽早集成到开发流程中去,并且尽早进行密钥轮转,经常进行密钥轮转。简单的说,在测试阶段就Fail可以更早的预防系统风险;在用户还很少的时候就Fail可以防止在...
    文章 2018-01-05 3981浏览量
  • Riverbed发布业界最全面的数字体验管理解决方案

    Aternity与AppInternals之间的集成工作流程为整个终端用户服务提供了一个集成监测系统,使得IT部门能够跨设备和应用为业务关键型应用快速排除故障。这将为包括终端用户服务、应用程序开发和运营以及IT和业务管理人员...
    文章 2017-09-01 980浏览量
  • Docker常见故障排查指南-阿里云容器服务

    对于Docker的初学者而言,...本文介绍了Docker故障的排查工具和操作指南,未来我们还会针对一些常见问题有针对性地介绍常见解决方法。想了解更多容器服务内容,请访问 https://www.aliyun.com/product/containerservice
    文章 2016-08-15 49395浏览量
  • CRaaS 产品简介

    监控系统集成:通过集成Zabbix和阿里云监控(开发中)实现统一的监控告警管理。便捷通知方式:支持通过钉钉进行消息通知,提供多样化通知形式,经济实惠。CRaaS架构 CRaaS总体架构 CRaaS由行业级平台和企业级平台...
    文章 2019-08-05 6005浏览量
  • SAP C4C中国本地化之微信聊天机器人的集成

    SAP解决方案和社交渠道集成的价值在于,通过该方式,用户可以随时方便地接入系统,同时系统的反馈信息也能实时快速地反馈给用户,这样系统和用户之间的交互效率和用户体验就大大提高了。另一方面,工单处理(Ticket)...
    文章 2018-11-20 1005浏览量
1 2 3 4 ... 26 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化