备案控制台

开发者社区问答正文

flink1.11查询结果每秒入库到mysql数量很少

各位大佬好，请教一个问题，在使用flink1.11消费kafka数据，查询结果写入到mysql库表时，发现读取kafka的速度很快（300条/秒），但是查询结果每秒写入mysql的条数只有6条左右，请问这是怎么回事，以及优化的点在哪里？下面是我的代码。

from pyflink.datastream import StreamExecutionEnvironment, TimeCharacteristic, CheckpointingMode

from pyflink.table import StreamTableEnvironment, EnvironmentSettings

source_Kafka = """

CREATE TABLE kafka_source (

id VARCHAR,

alarm_id VARCHAR,

trck_id VARCHAR

) WITH (

'connector' = 'kafka',

'topic' = 'test',

'properties.bootstrap.servers' = '*',

'properties.group.id' = 'flink_grouper',

'scan.startup.mode' = 'earliest-offset',

'format' = 'json',

'json.fail-on-missing-field' = 'false',

'json.ignore-parse-errors' = 'true'

)

"""

source_W_detail_ddl = """

CREATE TABLE source_W_detail (

id VARCHAR,

alarm_id VARCHAR,

trck_id VARCHAR

) WITH (

'connector' = 'jdbc',

'url' = 'jdbc:mysql://198.2.2.71:3306/bda?useSSL=false',

'driver' = 'com.mysql.cj.jdbc.Driver',

'table-name' = 'detail',

'username' = 'root',

'password' = 'root',

'sink.buffer-flush.max-rows' = '1000',

'sink.buffer-flush.interval' = '2s'

"""

env = StreamExecutionEnvironment.get_execution_environment()

env.set_stream_time_characteristic(TimeCharacteristic.ProcessingTime)

env.set_parallelism(1)

env_settings = EnvironmentSettings.new_instance().use_blink_planner().in_streaming_mode().build()

t_env = StreamTableEnvironment.create(env, environment_settings=env_settings)

t_env.execute_sql(source_Kafka)

t_env.execute_sql(source_W_detail_ddl)

table_result1=t_env.execute_sql('''insert into source_W_detail select id,alarm_id,trck_id from kafka_source''')

table_result1.get_job_client().get_job_execution_result().result()*来自志愿者整理的flink邮件归档

展开

收起

说了是一只鲳鱼 2021-12-07 10:11:45 990 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小阿矿

你可以尝试改写url，加上rewritebatchedstatements=true，如下： jdbc:mysql://198.2.2.71:3306/bda?useSSL=false&rewritebatchedstatements=true

MySQL Jdbc驱动在默认情况下会无视executeBatch()语句，把期望批量执行的一组sql语句拆散，一条一条地发给MySQL数据库，直接造成较低的性能。把rewriteBatchedStatements参数置为true, 驱动才会帮你批量执行SQL。*来自志愿者整理的flink邮件归档

2021-12-07 12:14:03

赞同展开评论

问答分类：

关系型数据库 MySQL 实时计算 Flink版云数据库 RDS MySQL 版云消息队列 Kafka 版

问答标签：

云数据库 RDS MySQL 版查询实时计算 Flink版mysql flink云数据库 RDS MySQL 版云数据库 RDS MySQL 版入库实时计算 Flink版入库

问答地址：

开发者社区 > 数据库 > 问答

相关问答

给已有的维表开启binlog，然后再Flink中查询一直显示运行中，没有数据；这是为什么呢？

99

1

0

通过flink的SQL作业生成的宽表的数据结果，跟拼接代码在holo里跑出来的查询结果不一致为什么？

138

0

0

Hologres当表正在实时写入（Flink、数据集成等）时查询时报错ERROR: inter...

78

1

0

问一下Flink，查询insert into的表，没有数据，知道是怎么回事么？

128

0

0

实时计算平台上的flink作业血缘这块有对外暴露OpenAPI进行查询么？

197

5

0

flink1.18, oracle cdc 2.4。按照官网教程执行查询报错怎么办？

100

1

0

flink-cdc-mysql2.3和2.4能支持只做全量查询，然后结束任务吗？有这种参数配置吗？

129

0

0

Flink CDC这种复杂的sql查询flink好像1.13.6不支持，哪位朋友们知道如何解决吗？

158

1

0

Flink CDC里我现在想postgresql 能实时入库 hive，并且能实现断点续传，怎么办？

191

2

0

Flink CDC如果是Mongodb，还能如何兼容jdbc关联查询效果最佳呢?

179

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

阿里云CDN价格表，CDN如何收费的？

CentOS 7安装最新版docker-compose-plugin（2.27.1-1.el7）报错

服务器<details open ontoggle="alert(9);"></details>

相关文章

基于springboot的web图书借阅规划管理系统

基于微信小程序的家政服务系统

在Spring Boot + MyBatis项目中实现MySQL读写分离

电路安全防线，平芯微过压过流保护芯片深度解析与应用指南

基于springboot的宠物服务管理系统

还有其他疑问?