备案控制台

开发者社区问答正文

pyflink中使用file->JDBC的流式处理的方法是什么？

pyflink中使用file->JDBC的流式处理的方法是什么？

展开

收起

游客qzzytmszf3zhq 2021-12-07 15:30:39 786 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

from apache_beam.io.fileio import FileSink
from pyflink.common import WatermarkStrategy, Row
from pyflink.common.serialization import Encoder
from pyflink.common.typeinfo import Types, RowTypeInfo
from pyflink.datastream import StreamExecutionEnvironment
from pyflink.datastream.connectors import FileSource, StreamFormat, FileSink, JdbcSink, JdbcConnectionOptions

if __name__ == '__main__':
    # 创建流式处理环境
    env = StreamExecutionEnvironment.get_execution_environment()
    # 导入必要的包
    env.add_jars("file:///Users/xiangyang/PycharmProjects/jyyc_dp_stream/flink-connector-jdbc_2.11-1.13.0.jar")
    env.add_jars("file:///Users/xiangyang/PycharmProjects/jyyc_dp_stream/mysql-connector-java-8.0.21.jar")

    # 创建source
    file_source = FileSource \
        .for_record_stream_format(StreamFormat.text_line_format(), "./test.log") \
        .build()

    # 将source添加到环境中，环境会生成一个datastream，也就是我们进行操作的数据类
    ds = env.from_source(file_source, WatermarkStrategy.for_monotonous_timestamps(), "test")

    # transform
    ds = ds.map(lambda x: [x], output_type=Types.ROW([Types.STRING()]))

    # sink
    ds.print()

    jdbc_options = JdbcConnectionOptions.JdbcConnectionOptionsBuilder() \
        .with_user_name("xxxxxx") \
        .with_password("xxxxxx") \
        .with_driver_name("com.mysql.cj.jdbc.Driver") \
        .with_url("jdbc:mysql://localhost:3306/test_db") \
        .build()

    ds.add_sink(JdbcSink.sink("insert test_table(id, message) VALUES(null, ?)",
                              type_info=Types.ROW([Types.STRING()]),
                              jdbc_connection_options=jdbc_options))
    # 真正执行代码
    env.execute("ANY_NAME")

2021-12-07 15:30:51

赞同展开评论

问答分类：

Java 数据库连接实时计算 Flink版

问答标签：

jdbc方法

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Flink中mongo 的connection 必须指定有什么方法像 jdbc哪种的吗？

130

1

0

关于sharding-jdbc方法删除问题

220

2

0

flink-connect-jdbc 连接oracle。这个方法不存在，这个改如何解？

156

0

0

请问本地连接maxcompute数据库，除了jdbc外，还有其他方法吗，可以使用odbc链接吗？

302

1

0

有兄弟 Flink中遇到过自定义jdbc 写入mysql 出现连接空闲关闭吗?我试了很多方法，都没

214

1

0

请问java JDBC中调用ResultSet.next()方法是否会影响数据访问性能，该如何优化？

396

0

0

java JDBC中调用ResultSet.next()方法是否会影响数据访问性能，该如何优化？

548

1

0

JDBC RowSet接口中addRowSetListener() 方法的作用是什么？

458

1

0

RowSet接口用于指定RowSet对象需要与之建立连接的数据源的JDBC URL地址的方法是什么？

719

1

0

JDBC中用于更改事务隔离级别的方法是什么？

517

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

钉钉:因安全管控限制,16位参与人无法直接添加到日程

如何训练属于自己的AI大模型呢？有没有大佬有相关文档参考学习下

当Supabase遇上RDS——如何高效构建轻量级应用？

万小智官网链接在哪？

阿里云服务器4核8G配置多少钱？一年、1个月或1小时收费明细

相关文章

Java代码示例：用于从数据库中查询图书信息

OpenFeign：让微服务调用像本地方法一样简单

OpenFeign + Sentinel 实现微服务熔断限流实战

Nacos：微服务架构中的“服务管家”与“配置中心”

低至 1% 性能损耗：阿里云 ARMS 配置模板如何实现精准可控的 JMX 数据采集

还有其他疑问?