大家好,本文为 Flink Weekly 的第二期,由 zhisheng 整理,主要内容包括:讨论在 Flink SQL 中支持 JSON functions,新增 Flink 国内社区的活动和相关博客,以及汇总中文邮件中大家遇到的问题。
Flink 开发
- [SQL] Forward Xu 发起了一个讨论,要在 Flink SQL 中支持 JSON functions,最后将讨论的结果和想法记录在了 FLIP-90 。
- [SQL] Jark Wu 发起一个讨论,建议在 1.10 release 之前将 Table API 和 SQL 中的 Time-windowed Join 改为 Interval Join。
- [core]Stephan Ewen 之前发起的一个讨论,关于新的 Task Manager 内存配置 FLIP-49。
已知缺陷
- [FLINK-15421] [1.9.1, 1.10.0] GroupAggsHandler throws java.time.LocalDateTime cannot be cast to java.sql.Timestamp。
https://issues.apache.org/jira/browse/FLINK-15421
- [FLINK-15420] [1.10.0] Cast string to timestamp will loose precision。
https://issues.apache.org/jira/browse/FLINK-15420
- [FLINK-15418] [1.9.1, 1.10.0] StreamExecMatchRule not set FlinkRelDistribution。
https://issues.apache.org/jira/browse/FLINK-15418
- [FLINK-15411][1.10.0] Planner can't prune partition on DATE/TIMESTAMP columns。
https://issues.apache.org/jira/browse/FLINK-15411
- [FLINK-15406] [1.9.1] The savepoint is writted by "State Processor API" can't be restore by map or flatmap。
https://issues.apache.org/jira/browse/FLINK-15406
- [FLINK-15381] [1.10.0] INSERT INTO VALUES statement fails if a cast project is applied。
https://issues.apache.org/jira/browse/FLINK-15381
- [FLINK-15370] [1.10.0, 1.11.0] Configured write buffer manager actually not take effect in RocksDB's DBOptions 在 DBOptions 中设置 WriteBufferManager 的值不起作用。
https://issues.apache.org/jira/browse/FLINK-15370
- [FLINK-15361] [1.9.1] ParquetTableSource should pass predicate in projectFields。
https://issues.apache.org/jira/browse/FLINK-15361
活动 / 博客文章 / 其他
- 社区钉钉群群直播——《基于 Apache Flink 的监控告警系统》,PPT 下载 & 直播视频回放地址:
https://ververica.cn/developers/flink-training-course3/
中文邮件问题/答疑汇总
- StreamTableEnvironment.registerDatastream() 开放用户自定义的 schemaDescriptionh 和 DeserializationSchema。
- 在 1.8 版本使用 yarn session 模式时是 1 个 Task Manager 一个 CPU,当切换到 1.9.1 时使用同样的启动命令发现一个 slot 使用一个 CPU。
http://apache-flink.147419.n8.nabble.com/slot-td1345.html
- Flink 1.9 批任务 yn 和 ys 对任务的影响。
http://apache-flink.147419.n8.nabble.com/Flink1-9-yn-ys-tp1313.html
- Flink SQL 1.9.0 如何创建 elasticsearch 动态索引表。
http://apache-flink.147419.n8.nabble.com/flink-sql-1-9-0-elasticsearch-tp1342.html
- source 并行度不同导致任务没有数据落地。
http://apache-flink.147419.n8.nabble.com/source-tp1336.html
- Flink 1.9 SQL Kafka Connector,Json format,how to deal with not json message。
- Flink 实现 Kafka 到 MySQL 的 End-To-End Exactly-Once 中遇到的问题。
http://apache-flink.147419.n8.nabble.com/Flink-Kafka-Mysql-End-To-End-Exactly-Once-tp1321.html
- Rewind offset to a previous position and ensure certainty。
- 关于 Flink historyserver 没有 completed-jobs 的问题。
http://apache-flink.147419.n8.nabble.com/FLink-historyserver-completed-jobs-tp1320.html
- Flink 维表关联,当维表更新后,如何将之前关联的数据进行更新。
http://apache-flink.147419.n8.nabble.com/flink-tp1322.html
- The assigned slot was removed 分配好的 slot 突然就被 remove 了,导致作业重启。
- Flink Checkpoint 配置 HDFS 问题,如何配置高可用。
http://apache-flink.147419.n8.nabble.com/flink-checkpoint-hdfs-tp1318.html
- 实现一个两阶段提交的 ETL,数据从 Kafka 到 MySQL,遇到的异常问题。
http://apache-flink.147419.n8.nabble.com/ETL-kafka-mysql-tp1317.html
- using thin jar to replace fat jar on yarn cluster mode。
- 关于 Window Process Function 数据丢失问题。
http://apache-flink.147419.n8.nabble.com/Window-ProcessFunction-tp1311.html
- 关于 Flink 窗口是否正确关闭的问题。
http://apache-flink.147419.n8.nabble.com/flink-tp1305.html
- CEP 匹配乱序数据的问题。
http://apache-flink.147419.n8.nabble.com/CEP-tp1301.html
2 分钟快速订阅 Flink 中文邮件列表
Apache Flink 中文邮件列表订阅流程:
发送任意邮件到 user-zh-subscribe@flink.apache.org
收到官方确认邮件
回复该邮件 confirm 即可订阅
订阅成功后将收到 Flink 官方的中文邮件列表的消息,您可以向 user-zh@flink.apache.org 发邮件提问也可以帮助别人解答问题,动动手测试一下!
Tips:
Flink Weekly 周报计划每周更新一期,内容涵盖邮件列表中用户问题的解答、社区开发和提议的进展、社区新闻以及其他活动、博客文章等,欢迎持续关注~
作者介绍:
zhisheng,《Flink 实战与性能优化》专栏作者、之前负责监控平台实时告警研发,现专注于 Flink 开发,积极活跃于开源社区,擅长 Flink、Kafka、ElasticSearch、监控告警等。