备案控制台

开发者社区问答正文

pyflink中使用file->JDBC的流式处理的方法是什么？

pyflink中使用file->JDBC的流式处理的方法是什么？

展开

收起

游客qzzytmszf3zhq 2021-12-07 15:30:39 797 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客yzrzs5mf6j7yy

from apache_beam.io.fileio import FileSink
from pyflink.common import WatermarkStrategy, Row
from pyflink.common.serialization import Encoder
from pyflink.common.typeinfo import Types, RowTypeInfo
from pyflink.datastream import StreamExecutionEnvironment
from pyflink.datastream.connectors import FileSource, StreamFormat, FileSink, JdbcSink, JdbcConnectionOptions

if __name__ == '__main__':
    # 创建流式处理环境
    env = StreamExecutionEnvironment.get_execution_environment()
    # 导入必要的包
    env.add_jars("file:///Users/xiangyang/PycharmProjects/jyyc_dp_stream/flink-connector-jdbc_2.11-1.13.0.jar")
    env.add_jars("file:///Users/xiangyang/PycharmProjects/jyyc_dp_stream/mysql-connector-java-8.0.21.jar")

    # 创建source
    file_source = FileSource \
        .for_record_stream_format(StreamFormat.text_line_format(), "./test.log") \
        .build()

    # 将source添加到环境中，环境会生成一个datastream，也就是我们进行操作的数据类
    ds = env.from_source(file_source, WatermarkStrategy.for_monotonous_timestamps(), "test")

    # transform
    ds = ds.map(lambda x: [x], output_type=Types.ROW([Types.STRING()]))

    # sink
    ds.print()

    jdbc_options = JdbcConnectionOptions.JdbcConnectionOptionsBuilder() \
        .with_user_name("xxxxxx") \
        .with_password("xxxxxx") \
        .with_driver_name("com.mysql.cj.jdbc.Driver") \
        .with_url("jdbc:mysql://localhost:3306/test_db") \
        .build()

    ds.add_sink(JdbcSink.sink("insert test_table(id, message) VALUES(null, ?)",
                              type_info=Types.ROW([Types.STRING()]),
                              jdbc_connection_options=jdbc_options))
    # 真正执行代码
    env.execute("ANY_NAME")

2021-12-07 15:30:51

赞同展开评论

问答分类：

Java 数据库连接实时计算 Flink版

问答标签：

jdbc方法

问答地址：

开发者社区 > 数据库 > 问答

相关问答

Flink中mongo 的connection 必须指定有什么方法像 jdbc哪种的吗？

146

1

0

关于sharding-jdbc方法删除问题

248

2

0

flink-connect-jdbc 连接oracle。这个方法不存在，这个改如何解？

177

0

0

请问本地连接maxcompute数据库，除了jdbc外，还有其他方法吗，可以使用odbc链接吗？

322

1

0

有兄弟 Flink中遇到过自定义jdbc 写入mysql 出现连接空闲关闭吗?我试了很多方法，都没

224

1

0

请问java JDBC中调用ResultSet.next()方法是否会影响数据访问性能，该如何优化？

419

0

0

java JDBC中调用ResultSet.next()方法是否会影响数据访问性能，该如何优化？

555

1

0

JDBC RowSet接口中addRowSetListener() 方法的作用是什么？

477

1

0

RowSet接口用于指定RowSet对象需要与之建立连接的数据源的JDBC URL地址的方法是什么？

730

1

0

JDBC中用于更改事务隔离级别的方法是什么？

541

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

相关文章

局域网员工电脑监控软件的跳表数据结构Java语言算法

宝塔面板部署Java项目全指南：JDK+Nginx+MySQL+Redis一站式配置

AI 原生应用开源开发者沙龙·杭州站精彩回顾 & PPT 下载

写单元测试太痛苦？教你用DeepSeek/通义千问一键生成高质量测试代码

还有其他疑问?