实时计算 Flink版产品使用问题之使用Spark ThriftServer查询同步到Hudi的数据时，如何实时查看数据变化-阿里云开发者社区

实时计算 Flink版产品使用问题之使用Spark ThriftServer查询同步到Hudi的数据时，如何实时查看数据变化

2024-07-16 275

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 实时计算Flink版作为一种强大的流处理和批处理统一的计算框架，广泛应用于各种需要实时数据处理和分析的场景。实时计算Flink版通常结合SQL接口、DataStream API、以及与上下游数据源和存储系统的丰富连接器，提供了一套全面的解决方案，以应对各种实时计算需求。其低延迟、高吞吐、容错性强的特点，使其成为众多企业和组织实时数据处理首选的技术平台。以下是实时计算Flink版的一些典型使用合集。

问题一：flink cdc哪个版本有sqlserverCatalog，能根据表名拿到对应的字段和字段类型？

flink cdc哪个版本有sqlserverCatalog，能根据表名拿到对应的字段和字段类型？

参考答案：

你指的是flink-connector-jdbc吧，这个是连接器的特性，1.17的好像就支持了

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/584664

问题二：flink cdc 每次都要重新在datagrip里面新开一个窗口才能看到数据的变化，为什么？

用spark thriftserver 查询flink cdc 同步到hudi的数据的时候，每次都要重新在datagrip里面新开一个spark query窗口才能看到数据的变化？

参考答案：

你这个是spark 的session 模式导致的bug吧，试下 refresh下 hudi的table呢

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/584662

问题三：阿里flink云服务，如何使用这种CDC整库？有没有案例？

阿里flink云服务，如何使用这种CDC整库？有没有案例？

参考答案：

直接用cdas就行了

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/584660

问题四：Flink这个 busy 是啥意思？

Flink这个 busy 是啥意思？

参考答案：

在Flink中，"busy"是指一个subtask的消费速率低于上游的生产，这个subtask的InputChannel buffer会被撑满，然后上游subtask的负责转发数据的nettyServer会收到消息，停止发送数据，直到上游subtask的ResultPartition撑满，上游的算子就被背压了。在这种情况下，一个subtask/算子是否背压和他本身的处理情况没有直接关系，而是取决于下游是否有subtask的处理速度一直低于输入速率；换言之，取决于下游算子的busy time。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586039

问题五：有人接过influxDB吗？Flink这里为什么没有提供setHost()？

有人接过influxDB吗？Flink这里为什么没有提供setHost()？

参考答案：

Flink中InfluxDB Connector的使用需要设置相关参数，包括InfluxDB的主机地址、数据库名称等。对于你提到的setHost()方法，在新版本的Flink InfluxDB Connector中可能已经不再使用。取而代之的是，你可以通过创建InfluxDbConfig对象来设定这些参数。具体来说，你可以这样配置：

public static List < JobLastCheckpointExternalPath > getCheckPoints (String jobId) {
    InfluxDbConfig config = new InfluxDbConfig (); 
    config. setHost ("http://influxdb.slankka.com:8099"); //根据实际情况修改 
    config. setDatabase ("flink"); //根据实际情况修改 
}

在这段代码中，我们首先创建了一个InfluxDbConfig对象，然后调用其setHost()和setDatabase()方法来分别设置InfluxDB的主机地址和数据库名称。需要注意的是，这里的URL是InfluxDB的服务地址，可以是VPC网络地址，例如：https://localhost:8086或http://localhost:3242。此外，这个模块与InfluxDB 1.3.x版本兼容。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/586026

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。