👉🏻场景
Dataphin 的监控告警功能提供全链路数据任务的异常检测能力,全面覆盖离线与实时计算任务、数据质量规则校验、数据服务等模块。系统可基于预设规则自动触发告警,并实时推送通知,助力用户快速定位与处理问题。而在实际业务场景中,企业用户对不同推送渠道、不同业务类型告警信息的呈现方式与内容存在差异化需求,下文将详细介绍Dataphin如何提供高效、易用的告警消息自定义能力。
👉🏻 解决方案及功能
这里我们以一个离线计算任务为例,配置钉群机器人的监控告警消息内容。
- 首先,从顶部菜单栏进入「我的」-「告警中心」-「消息模板」,选择告警对应的功能模块和消息渠道。这里我们选择【离线计算】模块,群机器人渠道。
- 进入消息模板编辑后,我们可以为任务出错、任务完成、运行超时等各类告警事件分别配置专属消息模板。系统预置简洁与详细两种模板模式,便于快速选用;同时支持基于丰富的告警元数据(如任务日志URL、任务负责人、执行时长、告警触发时间等)进行深度自定义。
这里,我们为【任务出错】报警配置自定义消息模板,包含任务名称、定时运行时间、报警时间、任务负责人和实例URL。
- 接下来,我们来到「运维」-「离线任务监控」模块,为一个离线任务配置出错告警规则,并选择钉钉作为消息接收渠道。
- 配置生效后,当该任务运行异常时,系统将自动通过钉钉推送定制化告警通知,助力运维人员及时响应处理。