备案控制台

开发者社区问答正文

flink1.11查询结果每秒入库到mysql数量很少

各位大佬好，请教一个问题，在使用flink1.11消费kafka数据，查询结果写入到mysql库表时，发现读取kafka的速度很快（300条/秒），但是查询结果每秒写入mysql的条数只有6条左右，请问这是怎么回事，以及优化的点在哪里？下面是我的代码。

from pyflink.datastream import StreamExecutionEnvironment, TimeCharacteristic, CheckpointingMode

from pyflink.table import StreamTableEnvironment, EnvironmentSettings

source_Kafka = """

CREATE TABLE kafka_source (

id VARCHAR,

alarm_id VARCHAR,

trck_id VARCHAR

) WITH (

'connector' = 'kafka',

'topic' = 'test',

'properties.bootstrap.servers' = '*',

'properties.group.id' = 'flink_grouper',

'scan.startup.mode' = 'earliest-offset',

'format' = 'json',

'json.fail-on-missing-field' = 'false',

'json.ignore-parse-errors' = 'true'

)

"""

source_W_detail_ddl = """

CREATE TABLE source_W_detail (

id VARCHAR,

alarm_id VARCHAR,

trck_id VARCHAR

) WITH (

'connector' = 'jdbc',

'url' = 'jdbc:mysql://198.2.2.71:3306/bda?useSSL=false',

'driver' = 'com.mysql.cj.jdbc.Driver',

'table-name' = 'detail',

'username' = 'root',

'password' = 'root',

'sink.buffer-flush.max-rows' = '1000',

'sink.buffer-flush.interval' = '2s'

"""

env = StreamExecutionEnvironment.get_execution_environment()

env.set_stream_time_characteristic(TimeCharacteristic.ProcessingTime)

env.set_parallelism(1)

env_settings = EnvironmentSettings.new_instance().use_blink_planner().in_streaming_mode().build()

t_env = StreamTableEnvironment.create(env, environment_settings=env_settings)

t_env.execute_sql(source_Kafka)

t_env.execute_sql(source_W_detail_ddl)

table_result1=t_env.execute_sql('''insert into source_W_detail select id,alarm_id,trck_id from kafka_source''')

table_result1.get_job_client().get_job_execution_result().result()*来自志愿者整理的flink邮件归档

展开

收起

说了是一只鲳鱼 2021-12-07 10:11:45 965 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小阿矿

你可以尝试改写url，加上rewritebatchedstatements=true，如下： jdbc:mysql://198.2.2.71:3306/bda?useSSL=false&rewritebatchedstatements=true

MySQL Jdbc驱动在默认情况下会无视executeBatch()语句，把期望批量执行的一组sql语句拆散，一条一条地发给MySQL数据库，直接造成较低的性能。把rewriteBatchedStatements参数置为true, 驱动才会帮你批量执行SQL。*来自志愿者整理的flink邮件归档

2021-12-07 12:14:03

赞同展开评论

问答分类：

关系型数据库 MySQL 实时计算 Flink版云数据库 RDS MySQL 版云消息队列 Kafka 版

问答标签：

云数据库 RDS MySQL 版查询实时计算 Flink版mysql flink云数据库 RDS MySQL 版云数据库 RDS MySQL 版入库实时计算 Flink版入库

问答地址：

开发者社区 > 数据库 > 问答

相关问答

canal如何实现将mysql多张表(月表)采集入库到目标表中(一张表)？

221

0

0

为什么在Flink 取查询数据一直转圈圈？

91

1

0

给已有的维表开启binlog，然后再Flink中查询一直显示运行中，没有数据；这是为什么呢？

73

1

0

对于Flink CDC，cdc快照阶段可以配置索引键，然后设定的索引进行查询吗？

61

1

0

Hologres当表正在实时写入（Flink、数据集成等）时查询时报错ERROR: inter...

67

1

0

问一下Flink，查询insert into的表，没有数据，知道是怎么回事么？

74

0

0

实时计算平台上的flink作业血缘这块有对外暴露OpenAPI进行查询么？

137

5

0

flink1.18, oracle cdc 2.4。按照官网教程执行查询报错怎么办？

84

1

0

flink-cdc-mysql2.3和2.4能支持只做全量查询，然后结束任务吗？有这种参数配置吗？

85

0

0

Flink CDC如果是Mongodb，还能如何兼容jdbc关联查询效果最佳呢?

112

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

资源部署与调用相关技术咨询

如何让 Dify on DMS 助力智能应用开发？

开通对象存储OSS收费吗？

阿里云服务器经常卡顿怎么解决

“数据超人”MCP工具，到底是怎么让数据‘燃’起来的？

相关文章

如何创建RDS MySQL定时任务？

基于springboot的半成品配菜管理系统

手把手搭本地 RAG！用阿里云 PolarDB、Lindorm+Ollama，数据隐私全自己把控

【赵渝强老师】基于PostgreSQL的MPP集群：Greenplum

【微电网】【创新点】基于非支配排序的蜣螂优化算法NSDBO求解微电网多目标优化调度研究(Matlab代码实现)

还有其他疑问?