开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

可观测监控Prometheus版 - 按量付费 这个在flink里是做什么用的啊?关掉会有影响吗?

可观测监控Prometheus版 - 按量付费 这个在flink 里是做什么用的啊?关掉 会有什么影响吗 ?

展开
收起
三分钟热度的鱼 2023-11-01 09:19:06 51 0
6 条回答
写回答
取消 提交回答
  • Prometheus 是一种流行的开源监控系统,用于收集和聚合有关基础设施和应用程序的各种指标,以便进行监控、告警和分析。Prometheus 可以收集由指标 exporters 推送的指标数据,并使用 Grafana 等可视化工具进行图形化显示。

    • 关闭 Prometheus 功能意味着您将不再能够收集 Flink 指标数据,这将使您失去监控和分析 Flink 应用程序的能力,从而无法得知应用的健康状况和性能。
    • 关闭 Prometheus 功能意味着您将无法接收告警通知,可能导致无法及时发现问题和修复问题。
    2023-11-01 22:07:11
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    Prometheus 是一款流行的分布式系统监视和警报工具,可以用于收集指标和事件,以及实时地提供可视化视图。Prometheus 版本提供按量计费模式,用于计算成本并控制成本。
    关闭 Prometheus 版本可能会影响您的监控能力,比如:无法实时监控您的集群状态,导致不能及时发现潜在问题。建议您开启 Prometheus 版本,以确保您可以及时发现问题和故障。
    希望以上内容能够帮助您理解 Prometheus 的作用,并且提供给您有关关闭 Prometheus 版本的潜在风险。

    2023-11-01 13:47:25
    赞同 展开评论 打赏
  • Prometheus是一个开源的监控系统,可以监控应用程序的性能和状态。在Flink中,Prometheus可以帮助监控Flink任务的状态和性能,例如任务失败的情况。此外,Prometheus还可以结合Grafana可视化工具,为Flink提供高效的监控和报警方案。

    "可观测监控Prometheus版 - 按量付费"是Prometheus提供的一种计费方式,该方式按照您的实际用量结算,在每个结算周期生成账单并从账户中扣除相应费用。这种计费方式主要涉及到上报指标采样点数量和指标存储时长两个计费项。基础指标(例如上报任意数量的基础指标)是免费的,仅对上报的自定义指标计费。指标存储时长方面,默认存储时长为15天,如需存储更长时间,可以在存储时长页面调整存储天数。

    如果您关闭了"可观测监控Prometheus版 - 按量付费",那么将无法享受到上述的监控服务和报警功能,可能会影响您对Flink任务的管理和运维。同时,如果已开通了按量付费方式,需要变更某些Prometheus实例的付费方式为包年包月。因此,建议在关闭之前仔细考虑其可能带来的影响。

    2023-11-01 11:56:00
    赞同 展开评论 打赏
  • Prometheus 版本的可观测监控主要是收集和展示实时指标数据,以及生成可视化图表和仪表板,便于用户更好地监控和管理应用程序。按量付费是针对 Prometheus 的扩展功能,比如长期存储、报警通知、服务端扩缩容等功能进行收费的服务模式。
    如果关闭 Prometheus 版本的可观测监控,那么应用程序的相关指标将不再被采集、存储和展现,用户将无法查看实时状态、告警等信息,从而无法及时发现问题并做出响应。如果没有其他可替代的方式,建议保持开启,以便及时监控和发现问题。
    https://help.aliyun.com/zh/flink/user-guide/discard-or-restore-metrics?spm=a2c4g.11186623.0.i42
    image.png

    2023-11-01 10:13:38
    赞同 展开评论 打赏
  • 监控告警哈,你也可以把作业监控指标打到你自己的系统里。自建 Prometheus或者上报到 sls/kafka,针对上报的数据,自己实现告警逻辑。lQLPJwjTCId3rEDNBPbNBtKwECGyph_1cFAFKISqdMCwAA_1746_1270.png影响后续问题排查,比如:
    ①任务频繁 Failover,Failover100 次,需要知道第一次 Failover 时间,那个是 root cause
    ②checkpoint 长时间失败,需要看下什么时间点失败,失败时 taskmanager负载,是不是 cpu、内存压力大、任务反压导致的
    ③JobManager 重启/taskmanager heartbeat 等 oom 导致的问题,需要曲线分析
    ④开窗无数据输出/数据结果少,需要看 watermark 相关曲线,是不是有迟到数据丢弃

    等等等lQLPJyAzgfczHxDNAwbNBTiwDoW4HjpXbh8FKIrtkEC8AA_1336_774.png
    lQLPJyAzgfczHxDNAwbNBTiwDoW4HjpXbh8FKIrtkEC8AA_1336_774.png
    lQLPJxMOYLSGcRDNBMLNCnCwXdXcgeyggqMFKIsFzUC8AA_2672_1218.png
    lQLPJx2_9QpVQhDNBOrNCpaw__jIUBZK6JIFKIsdcYC8AA_2710_1258.png
    5f72cb14fb261b63db60748505e144a9.png

    此回答整理自钉群“实时计算Flink产品交流群”

    2023-11-01 10:05:01
    赞同 展开评论 打赏
  • Prometheus 是一种开源分布式系统监视和警报工具,可以收集度量数据并显示在一个图形化的界面中。可观测监控 Prometheus 版本提供了许多强大的功能,其中包括按量计费和免费存储。
    关闭按量付费功能会影响数据存储时间长度。例如,如果没有开启按量付费,Prometheus 仅能保存一定天数的数据,否则数据会被删除。

    2023-11-01 09:41:06
    赞同 1 展开评论 打赏
滑动查看更多

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载