Serverless AI训练营:课时7:函数计算的可观测性(二)
课时7:函数计算的可观测性(二)
高级查询
这里可以直接查询比如说有几个函数都是打到 hello world 里面,可以通过函数名称、服务名称、来找到指定函数
查看指标的两种或方式:
①是通过函数详情查看监控指标
②通过配置日志大盘
函数计算提供了丰富的系统指标,函数详情查看监控指标是不需要用户任何配置通过控制台查看;
日志大盘不仅可以看到函数运算提供的监控指标,同时可以和开发者的日志关联到一起生成自定义的监控指标。
首先看一下默认的监控指标
这里可以看到之前使用的函数情况、执行时间、错误情况、调用次数等
返回首页-配置日志大盘,新建关联(关联自己的 Serverless)
就可以看到监控大盘了,会展示一些指标
链路追踪
链路追踪可以分析分布式系统中请求在各个链路的时延
链路追踪是分布式系统排查问题的重要一环,可以分析分布式系统中请求在各个链路的时延有以下几种情况
1. 函数计算作为整个链路中的一环,可以看到请求在函数计算上的时延,时延包括系统启动的时间和非智能函数执行时间可以帮用户分析性能瓶颈。
2. 函数计算当中调用 SDK 可以默认看到 SD K的调动时延
3. 开发者在函数代码中访问数据库等产品可以手动在函数中埋点来分析这段时延。
tracing-service 和 tracing-function有两个大段一个是系统的启动时间一个是函数的执行时间,系统的启动时间大概是650毫秒准备代码,启动 right time 用了400毫秒。
函数代码是函数去调用了其他服务,比如说去访问了 IDS,可以看到请求在函数计算整个的一个延时瀑布图,可以帮助用户分析性能瓶颈。
三、性能问题排查
最后解读性能排查,详细介绍排查示例
场景一:新版本发布后,函数错误率升高
场景二:函数性能差,执行超时
场景三:业务量迅速扩张,并发度即将到达并发度限制
①场景一是新版本发布后,函数错误率升高,首先发布版本之后要首先观察函数的各项指标,一旦错误率升高就要立即回滚来避免故障 ,查看函数日志定位错误原因,修复问题再次上新。
②场景二是函数性能差,执行超时,在函数内部可能耗时的地方进行埋点,查看请求的瀑布图,定位时间长的原因并且修复问题。
③场景三是业务量迅速扩张,并发度即将到达并发度限制,在Metrics 看到当前并发度观察到并发度持续上升的时候就需要及时提升并发度。