• 稳定性专题|StackOverFlowError 常见原因及解决方法

    无限递归循环调用(最常见)。执行了大量方法,导致线程栈空间耗尽。方法内声明了海量的局部变量。native 代码有栈上分配的逻辑,并且要求的内存还不小,比如 java.net.SocketInputStream.read0 会在栈上要求分配...
    文章 2019-08-09 11002浏览量
  • 如何做到全年配送 0 故障?盒马揭秘 12个关键技术

    消费最多重试16次,最大重试间隔2小时,可修改重试间隔减少重试时间,可以设置Metaq循环重试,超过15次后再发送一条metaq,形成metaq循环,不建议死循环,可通过消费时间进行控制。(5)metaq qps/tps 发送和消费的...
    文章 2020-02-18 619浏览量
  • 云原生时代,企业多活容灾体系构建思路与最佳实践

    这其中很重要的是技术上的实现,在数字这一层要想办法去避免循环复制的问题,不能在把数据同步之后,另外一个机房认为是新增的数据又复制回来。而在多个机房的情况下,传统方式是在数据库内用序列号,在多活里面序列...
    文章 2021-07-02 5338浏览量
  • 2019你会被裁员吗?

    随着我们的业务量越来越大和越重要,单体的架构模式已经无法对应大规模的应用场景,而且系统中决不能存在单点故障导致整体不可用,所以只有垂直或是水平拆分业务系统,使其形成一个分布式的架构,利用分布式架构来...
    文章 2019-04-09 1987浏览量
  • 《Python分布式计算》第7章 测试和调试分布式应用...

    序言第1章 并行和分布式计算介绍第2章 异步编程第3章 Python的并行计算第4章 Celery分布式应用第5章 云平台部署Python第6章 超级计算机使用Python 第7章 测试和调试分布式应用第8章 继续学习 无论大小的分布式应用...
    文章 2017-10-18 1021浏览量
  • Serverless 工作流实现分布式定时调度

    对很多业务来说定时调度是最常见的需求,比如实现一个集群多台机器的定时状态检查。传统的通过 crond 服务来实现作业定时执行存在以下问题: 单机不稳定,如果 crond 服务停止或机器故障都会导致业务中断。配置多台 ...
    文章 2020-06-02 1242浏览量
  • ARMS在APM工具选型中的实践

    5、智能合并能力ARMS对于相同的调用,例如递当,循环会进行智能合并,显示循环的次数,执行的最大时长,最小时长,平均时长。6、主动诊断能力ARMS提供了主动诊断能力,可以通过选定具体的时间,执行主动诊断,ARMS会...
    文章 2020-09-16 1746浏览量
  • 车联网上云最佳实践(一)

    防火墙:当前在传统IDC机房中应用的最前端是一台防火墙,用来防御一些常见的攻击和访问控制的操作。因为防火墙并不是什么高端防火墙所以防御能力有限。因公司业务快速发展,期间已经更换过2次防火墙,分别是用户规模...
    文章 2018-08-31 2919浏览量
  • Flink on YARN(上):一张图轻松掌握基础架构与启动...

    下篇将根据社区大反馈,解答客户端和Flink Cluster的常见问题,分享相关问题的排查思路。Flink on YARN 流程图 Flink on YARN集群部署模式涉及YARN和Flink两大开源框架,应用启动流程的很多环节交织在一起,为了...
    文章 2019-09-25 6308浏览量
  • 分享实录|阿里巴巴DevOps文化浅谈

    通过前面对阿里巴巴DevOps发展的介绍,我们不难发现这样一个循环:我们在软件研发过程中不断的遇到新的问题,从而催生出新的技术(比如微服务、容器化);然后新的技术又带来了架构的变革(比如服务化、技术中台);...
    文章 2020-03-30 3200浏览量
  • 程序性能优化入门锦集-设计+代码+JVM调优+数据库优化...

    这里就引发了一个问题,当热点Key突发时(有的甚至存储的是Pkey-Skey结构,举个例子某条数据如下结构:id:{成员id:成员信息value},id和成员id即是Pkey和Skey),问题如何排查才能使Tair不被击穿?热点Key解决...
    文章 2018-07-17 1817浏览量
  • 阿里云栖开发者沙龙PHP技术专场-RabbitMQ 的延时队列...

    双重死信在使用过程中需注意消息处理的死循环问题,因为消息可能无限循环地进入死信队列。生产环境下使用RabbitMQ应注意的事项 生产环境下,RabbitMQ通过使用集群模式。集群模式下,只有元信息分布在所有节点中。元...
    文章 2019-04-25 1382浏览量
  • 【Java开发者专场】阿里专家杜万:Java响应式编程,...

    常见的server中会用循环发数据后,在循环外取出,但在下图的实现中没有,因为这不是使用阻塞模型实现,是基于非阻塞的异步编程实现。响应式编程是一种数据流编程,关注于数据流而不是控制流。下图中,首先当页面出现...
    文章 2018-12-27 2925浏览量
  • 如何正确地实现重试(Retry)?

    ▐ 固定循环次数方式这是最常见的版本&xff0c;样板方法为&xff1a;比如&xff1a;这种方式的问题在于&xff1a;不带backoff的重试&xff0c;对于下游来说会在失败发生时进一步遇到更多的请求压力&xff0c;继而进一步恶化。▐ 带...
    文章 2021-09-18 46浏览量
  • [雪峰磁针石博客]大数据Hadoop工具python教程9-Luigi...

    Oozie工作流是在XML文档中指定的控制依赖性指导非循环图(DAG)中排列的动作集合。虽然Oozie在Hadoop社区中有很多支持,但通过XML属性配置工作流和作业的学习曲线非常陡峭。Luigi是Spotify创建的Python替代方案,可以...
    文章 2019-01-28 1410浏览量
  • 容器加速业务创新,Serverless Kubernetes之解读

    使用Classic Kebernetes的常见步骤:选择机器的数量并做容器规划,节点规格、数据盘选择,配置复杂的管理工具与容器,配置调度与编排,对系统进行软件审计和安全补丁更新,最后对系统进行监控和维护。Serverless+...
    文章 2018-05-29 3305浏览量
  • 阿里云重磅发布云上自动化利器——运维编排OOS

    等到操作熟练以后,又容易掉以轻心,最好操作失误,触发故障。第二阶段:逐步累积了一些运维脚本和一些小工具,帮助完成单一的运维任务。比起第一阶段,完成单一运维任务的效率提高了很多。但是在处理批量任务时,...
    文章 2019-07-09 81308浏览量
  • 优秀工程师必备的一项技能,你解锁了吗?

    我们来看一下几类在程序员成长、发展的常见问题,如果你或多或少存在一些,那么恭喜你,这篇文章值得你仔细往下看了: 你自认为付出了跟别人同样的努力,但是你的成长确实更慢一些,比如学得比别人慢,排查问题比...
    文章 2019-06-13 38199浏览量
  • 购买服务器必须知道的小知识

    是一种在单一主机或主机上,比如物理服务器、VPS服务器或者云服务器上安装例如CPanel、Plesk等面板搭建而成的。虚拟主机市场比较混乱,使用云服务器最好(推荐阿里云),物理服务器也可以,但一般不推荐VPS作为...
    文章 2020-09-18 575浏览量
  • Node.js 应用故障排查手册 —— Node.js 性能平台使用...

    本节将从 Node.js 性能平台 的设计架构、核心能力以及最佳实践等角度,帮助开发者更好地使用这一工具来解决前面提到的异常指标分析和线上 Node.js 应用故障定位。本书首发在 Github,仓库地址:...
    文章 2019-03-23 1575浏览量
  • 浅谈:前端如何赋能业务?

    另一个不能忽视的是,如何变得更『稳』,因为大家都很急,一急就容易出线上故障,然后时间都花在处理故障上了,然后时间就更急,一个快速腐化的死循环,然后你能怎么办呢?只能以猝死明志啊……常见的有以下几种方法...
    文章 2019-04-17 1733浏览量
  • 如何提高一个研发团队的“代码速度”?

    这几方面的回归能力相互之间是相辅相成的,能够形成正循环,产生“飞轮效应”: 回归的运行,只有真正做到了无人值守,才有可能长期高频次运行。高频次的运行,可以充分暴露各种稳定性问题,提高回归的稳定性。缩短...
    文章 2018-07-24 3494浏览量
  • 带你读《深入理解以太坊》之二:设计理念

    下面以 Go 客户端代码实现进行分析,使用的是 f[1600]函数,f[b]中的每一轮置换都包含 5 个步骤,总共循环 24 轮。func keccakF1600(a*[25]uint64){/Implementation translated from Keccak-inplace.c/in the keccak...
    文章 2019-10-29 1969浏览量
  • 带你读《软件测试(原书第2版)》之一:软件测试的...

    为了避免循环定义,就需要给出缺陷的明确定义。首先需要了解一个辅助术语:产品说明书(product specification)。产品说明书有时又简称为说明(spec)或产品说明(product spec),是软件开发小组的一个协定。它对...
    文章 2019-10-31 1037浏览量
  • WSDM 2021|构建动态图分析时间序列状态的演化

    近年来,可解释的时序建模多着眼于离散时序,在时间轴上将时序分段,然后从分段中抓出可以用于判断异常的表示,常见的方法有: 字典方法[3],找时序分段的特征值 形状方法[4],找时序分段的特殊波形 聚类方法[5],找...
    文章 2020-11-05 2272浏览量
  • IBM原厂资深专家:DB2优化器和成本模型分析

    11月17日,IBM资深软件工程师刘俊老师在DB2用户进行了一次“浅析DB2优化器和成本模型”的线上主题分享。小编特别整理出其中精华内容,供大家学习交流。嘉宾简介 IBM资深软件工程师 自2005年以来一直从事DB2性能...
    文章 2017-05-02 1314浏览量
  • 应用运维智能化的关键技术——《应用智能运维实践...

    循环神经网络&xff08;Recurrent Neural Network&xff0c;RNN&xff09;等神经网络在时间序列数据异常检测方面具有一定的优势&xff0c;是对于时间序列数据训练最常见的算法模型之一。然而&xff0c;由于梯度消失问题的存在&xff0c...
    文章 2021-07-06 411浏览量
  • 阿里云大数据计算平台的自动化、精细化运维之路

    阿里巴巴 基础架构事业-技术专家 花名萧一,2010年加入阿里巴巴,现任阿里巴巴集团大数据计算平台运维负责人。团队主要负责阿里巴巴各类离在线大数据计算平台(如MaxCompute、AnalyticDB、StreamCompute等)的运维...
    文章 2017-02-28 10179浏览量
  • 我的第一个python web开发框架(19)——产品发布相关...

    今年我在的公司也试过发生比较严重的问题,合作公司的小伙伴开发时代码循环写错了,没有经过全面测试就直接发布,APP发版后造成我方生产环境业务接口访问量暴增,短短几天访问量暴涨到6千万,服务器流量、CPU、内存...
    文章 2017-11-08 1068浏览量
  • BPEL_Oracle BPEL新一代工作流介绍(概念)

    Oracle BPEL Process Manager 执行标准的 BPEL 流程并提供“脱水”功能,因此长期运行流的状态在数据库中能够得以自动维护,从而实现了用于故障切换和可伸缩性的集群。BPEL Server 利用的是基础 J2EE 应用服务器。(3...
    文章 2014-07-25 983浏览量
1 2 3 >

云产品推荐

视频直播 大数据计算服务 MaxCompute 国内短信套餐包 ECS云服务器安全配置相关的云产品 开发者问答 阿里云建站 新零售智能客服 万网 小程序开发制作 视频内容分析 视频集锦 代理记账服务 阿里云AIoT 阿里云科技驱动中小企业数字化