可观测监控Prometheus版 - 按量付费 这个在flink 里是做什么用的啊?关掉 会有什么影响吗 ?
Prometheus 是一种流行的开源监控系统,用于收集和聚合有关基础设施和应用程序的各种指标,以便进行监控、告警和分析。Prometheus 可以收集由指标 exporters 推送的指标数据,并使用 Grafana 等可视化工具进行图形化显示。
Prometheus 是一款流行的分布式系统监视和警报工具,可以用于收集指标和事件,以及实时地提供可视化视图。Prometheus 版本提供按量计费模式,用于计算成本并控制成本。
关闭 Prometheus 版本可能会影响您的监控能力,比如:无法实时监控您的集群状态,导致不能及时发现潜在问题。建议您开启 Prometheus 版本,以确保您可以及时发现问题和故障。
希望以上内容能够帮助您理解 Prometheus 的作用,并且提供给您有关关闭 Prometheus 版本的潜在风险。
Prometheus是一个开源的监控系统,可以监控应用程序的性能和状态。在Flink中,Prometheus可以帮助监控Flink任务的状态和性能,例如任务失败的情况。此外,Prometheus还可以结合Grafana可视化工具,为Flink提供高效的监控和报警方案。
"可观测监控Prometheus版 - 按量付费"是Prometheus提供的一种计费方式,该方式按照您的实际用量结算,在每个结算周期生成账单并从账户中扣除相应费用。这种计费方式主要涉及到上报指标采样点数量和指标存储时长两个计费项。基础指标(例如上报任意数量的基础指标)是免费的,仅对上报的自定义指标计费。指标存储时长方面,默认存储时长为15天,如需存储更长时间,可以在存储时长页面调整存储天数。
如果您关闭了"可观测监控Prometheus版 - 按量付费",那么将无法享受到上述的监控服务和报警功能,可能会影响您对Flink任务的管理和运维。同时,如果已开通了按量付费方式,需要变更某些Prometheus实例的付费方式为包年包月。因此,建议在关闭之前仔细考虑其可能带来的影响。
Prometheus 版本的可观测监控主要是收集和展示实时指标数据,以及生成可视化图表和仪表板,便于用户更好地监控和管理应用程序。按量付费是针对 Prometheus 的扩展功能,比如长期存储、报警通知、服务端扩缩容等功能进行收费的服务模式。
如果关闭 Prometheus 版本的可观测监控,那么应用程序的相关指标将不再被采集、存储和展现,用户将无法查看实时状态、告警等信息,从而无法及时发现问题并做出响应。如果没有其他可替代的方式,建议保持开启,以便及时监控和发现问题。
https://help.aliyun.com/zh/flink/user-guide/discard-or-restore-metrics?spm=a2c4g.11186623.0.i42
监控告警哈,你也可以把作业监控指标打到你自己的系统里。自建 Prometheus或者上报到 sls/kafka,针对上报的数据,自己实现告警逻辑。影响后续问题排查,比如:
①任务频繁 Failover,Failover100 次,需要知道第一次 Failover 时间,那个是 root cause
②checkpoint 长时间失败,需要看下什么时间点失败,失败时 taskmanager负载,是不是 cpu、内存压力大、任务反压导致的
③JobManager 重启/taskmanager heartbeat 等 oom 导致的问题,需要曲线分析
④开窗无数据输出/数据结果少,需要看 watermark 相关曲线,是不是有迟到数据丢弃
等等等
此回答整理自钉群“实时计算Flink产品交流群”
Prometheus 是一种开源分布式系统监视和警报工具,可以收集度量数据并显示在一个图形化的界面中。可观测监控 Prometheus 版本提供了许多强大的功能,其中包括按量计费和免费存储。
关闭按量付费功能会影响数据存储时间长度。例如,如果没有开启按量付费,Prometheus 仅能保存一定天数的数据,否则数据会被删除。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。