开发者社区> 问答> 正文

分析定位造成反压的原因时,如何判断是代码问题的问题?

已解决

分析定位造成反压的原因时,如何判断是代码问题的问题?

展开
收起
詹姆斯邦德00 2022-10-17 11:33:40 295 0
1 条回答
写回答
取消 提交回答
  • 推荐回答

    最有用的办法就是对 TaskManager 进行 CPU profile,从中我们可以分析到 Task Thread 是否跑满一个 CPU 核:如果是的话要分析 CPU 主要花费在哪些函数里面,比如我们生产环境中就偶尔遇到卡在 Regex 的用户函数(ReDoS);如果不是的话要看 Task Thread 阻塞在哪里,可能是用户函数本身有些同步的调用,可能是 checkpoint 或者 GC 等系统活动导致的暂时系统暂停。目前flink版本提供了火焰图的来分析CPU的性能瓶颈。

    image.png

    以上内容摘自《企业级云原生白皮书项目实战》电子书,点击https://developer.aliyun.com/ebook/download/7774可下载完整版

    2022-10-17 19:37:39
    赞同 展开评论 打赏
来源圈子
更多
收录在圈子:
阿里云开发者社区官方技术圈,用户产品功能发布、用户反馈收集等。
问答排行榜
最热
最新

相关电子书

更多
面向失败设计 立即下载
动态、高效,蚂蚁动态卡片的内核逻辑 立即下载
“静态调用链路发现”应用场景分析及实践探索 立即下载