实战！配置DataDog监控Apache Hudi应用指标-阿里云开发者社区

实战！配置DataDog监控Apache Hudi应用指标

2024-03-12 22

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实战！配置DataDog监控Apache Hudi应用指标

1. 可用性

在Hudi最新master分支，由Hudi活跃贡献者Raymond Xu贡献了DataDog监控Hudi应用指标，该功能将在0.6.0 版本发布，也感谢Raymond的投稿。

2. 简介

Datadog是一个流行的监控服务。在即将发布的Apache Hudi 0.6.0版本中，除已有的报告者类型（Graphite和JMX）之外，我们将引入通过Datadog HTTP API报告Hudi指标的功能。

3. 配置

类似于其他支持的报告者，启用Datadog报告者需要以下两个属性。

hoodie.metrics.on=true
hoodie.metrics.reporter.type=DATADOG

下面的属性用来配置Datdog API站点。它会决定请求被发送给 api.datadoghq.eu (EU) 还是 api.datadoghq.com (US)。根据你的Datadog账号作相应配置。

hoodie.metrics.datadog.api.site=EU # 或者 US

hoodie.metrics.datadog.api.key可以让你配置API密匙。

hoodie.metrics.datadog.api.key=<你的API密匙>
hoodie.metrics.datadog.api.key.supplier=<你的API密匙提供者>

出于安全性考虑，你可能会选择在运行时返回API密匙。要使用这个方法，需要实现 java.util.function.Supplier<String>。并把实现类的完整类名设置到 hoodie.metrics.datadog.api.key.supplier。由于 hoodie.metrics.datadog.api.key有更高的优先级，也要确保它没有设置。

下面的属性用来配置指标前缀，从而区分不同job的指标。

hoodie.metrics.datadog.metric.prefix=<你的指标前缀>

注意这里 .会被用来隔离前缀和指标名。比如，如果前缀是 foo，则 foo.会被加在指标名称前。

其他的可选属性在配置参考页里有相关解释。

4. 示例演示

在这个示例中，我们运行了一个 HoodieDeltaStreamer，启用了指标收集并做了相应的配置。

如图所示，我们能收集到Hudi操作相关的指标，比如

<前缀>.<表名>.commit.totalScanTime
<前缀>.<表名>.clean.duration
<前缀>.<表名>.index.lookup.duration

以及 HoodieDeltaStreamer相关的指标。

<前缀>.<表名>.deltastreamer.duration
<前缀>.<表名>.deltastreamer.hiveSyncDuration

5. 总结

Hudi提供了多种报告者，方便监控Hudi应用运行时的各项指标，及时发现系统中的问题。

实战！配置DataDog监控Apache Hudi应用指标

2. 简介

3. 配置

4. 示例演示

5. 总结

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推荐镜像