备案控制台

开发者社区大数据与机器学习实时计算 Flink 文章正文

Flink数据问题之数据写入Redis失败如何解决

2024-02-25 383

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

实时计算 Flink 版，1000CU*H 3个月

简介： Apache Flink是由Apache软件基金会开发的开源流处理框架，其核心是用Java和Scala编写的分布式流数据流引擎。本合集提供有关Apache Flink相关技术、使用技巧和最佳实践的资源。

问题一：使用RedisSink无法将读取的Kafka数据写入Redis中

现在我所在的项目组在调研Flink框架，有一个指标需要读取Kafka中的数据然后使用Redis存储最终的结果。我们在pom文件中引入了flink-redis的connector，然后按照官方的RedisSink案例，在本地开发的时候可以正常写入到某台服务器上的Redis中，但是当我把程序打成Jar包之后，部署到服务器（华为云MRS）上使用flink run提交到yarn之后总是在报错，无法写入到Redis中，各位知道是为什么吗？问题已经卡了我两天了，一点进展都没有，有劳各位帮忙解答一下，Thank you！报错如下： redis.client.jedis.exceptions.JedisConnectionException:Could not get a resource from the pool at ..... *来自志愿者整理的flink邮件归档

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/370077?spm=a2c6h.13066369.question.43.33bf585fa51mJr

问题二：为什么要关闭calcite的隐式转换功能

目前flink sql，flink hive sql都不支持隐式转换功能。我们在调试的时候发现其实calcite本身是支持的。但是flink这边强制关闭了。而hive本身是支持隐式转换的。这导致我们的hive任务无法迁移到flink上执行。请问关闭的原因是什么？如果我们这边开启会带来什么问题吗？ *来自志愿者整理的flink邮件归档

参考答案：

我理解可能是calcite隐式类型转换功能还比较新，暂时没有启用。不过即使开启

了跟hive的隐式转换逻辑也不一定完全一致，比如某些hive允许的转换calcite可能不允许。目前社区也在做hive语法兼容的工作，这个功能有了以后迁移hive任务会更容易。

*来自志愿者整理的flink邮件归档

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/370078?spm=a2c6h.13066369.question.42.33bf585fKWFQdd

问题三：flinksql维表join之后不能做些过滤这样的操作吗？

rt*来自志愿者整理的flink邮件归档

参考答案：

你是需要对维表里面的某些字段进行计算过滤等吗，可以参考：https://github.com/apache/flink/blob/53a4b4407816c2780fed2f8995affbebc1f58c3c/flink-table/flink-table-planner-blink/src/test/scala/org/apache/flink/table/planner/runtime/stream/sql/LookupJoinITCase.scala#L162 *来自志愿者整理的flink邮件归档

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/370079?spm=a2c6h.13066369.question.45.33bf585frZU2wb

问题四：使用DataStream → IterativeStream → DataStream 出问题

想请教各位一个问题：目前有一个这样的需求：

两个事实流A 和B, 需要使用B 去关联A 。现在A的消息可能比B或早或晚达到，时间长度最长可能晚两天。

目前方案是：StreamA connect StreamB , 将A、B分别去对方的mapstate中去关联，关联上则下发，关联不上则写入自己的mapstate中,等待对方来关联。但是目前还是存在一些误差，猜测是部分AB的消息同时到达同时写入自身的mapstate中，无法触发关联下发。

所以目前在想了另一个方案：将流A写入外部kv（tair）存储中, 然后用B采用.iterate()的方式持续去关联tair。现在有个疑问，比如有部分数据关联不上，那么B中有消息产生死循环持续运行关联，这个问题有没有什么好的解决方案

*来自志愿者整理的flink邮件归档

参考答案：

我认为你后提出的那个方法没用，不清楚你想怎么做。

这个问题本身用你的第一个方法是没问题的，误差可以再分析下，不存在你说的2个同时写入的逻辑（flink的task是单线程，不会有并发问题）。

其次，你说的第一种方法（connect）的方式，flink本身就提供了现成的实现的，即intervalJoin，貌似不需要你自己去实现。

*来自志愿者整理的flink邮件归档

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/370080?spm=a2c6h.13066369.question.46.33bf585f8zEBHs

问题五：生产hive sql 迁移flink 11 引擎，碰到的问题

最近尝试把一个生产 hive sql 任务，执行引擎切换成 flink 1.11.2 ，发现flink 11 对hive SQL的支持有下列问题1、不支持双引号表示字符串

2、不支持 != 表示不等运算

3、不支持类型隐式转换

4、不支持 split 函数

5、hive 不区分大小写，flink区分大小写

6、join右表不支持是一个子查询（Calcite bug https://issues.apache.org/jira/browse/CALCITE-2152）

7、不支持 create table table1 as select * from pokes; 中的 as

暂时只测到这些问题。总体感觉flink11 对 hive SQL的语句支持还不够，无法把已有离线 hive sql 任务直接切换到flink 引擎。 *来自志愿者整理的flink邮件归档

参考答案：

Hi,

Flink SQL 1.11 暂时还不兼容 Hive SQL 语法。这个功能的设计，最近才在社区中讨论，预计1.13中支持。可以关注下这个

design 的讨论： http://apache-flink-mailing-list-archive.1008284.n3.nabble.com/DISCUSS-FLIP-152-Hive-Query-Syntax-Compatibility-td46928.html *来自志愿者整理的flink邮件归档

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/370081?spm=a2c6h.13066369.question.47.33bf585fTmSkdl

文章标签：

实时计算 Flink版

云数据库 Tair（兼容 Redis）

流计算

SQL

HIVE

NoSQL

Redis

关键词：

实时计算 Flink版数据

数据云数据库 Tair（兼容 Redis）

flink云数据库 Tair（兼容 Redis）

实时计算 Flink版redis

云数据库 Tair（兼容 Redis）如何解决

相关实践学习

基于Hologres+Flink搭建GitHub实时数据大屏

通过使用Flink、Hologres构建实时数仓，并通过Hologres对接BI分析工具（以DataV为例），实现海量数据实时分析.

实时计算 Flink 实战课程

如何使用实时计算 Flink 搞定数据处理难题？实时计算 Flink 极客训练营产品、技术专家齐上阵，从开源 Flink功能介绍到实时计算 Flink 优势详解，现场实操，5天即可上手！欢迎开通实时计算 Flink 版： https://cn.aliyun.com/product/bigdata/sc Flink Forward Asia 介绍： Flink Forward 是由 Apache 官方授权，Apache Flink Community China 支持的会议，通过参会不仅可以了解到 Flink 社区的最新动态和发展计划，还可以了解到国内外一线大厂围绕 Flink 生态的生产实践经验，是 Flink 开发者和使用者不可错过的盛会。去年经过品牌升级后的 Flink Forward Asia 吸引了超过2000人线下参与，一举成为国内最大的 Apache 顶级项目会议。结合2020年的特殊情况，Flink Forward Asia 2020 将在12月26日以线上峰会的形式与大家见面。

三分钟热度的鱼

目录

相关文章

灵杰开发者

|

4月前

|

SQL 人工智能 JSON

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

简介：本文整理自阿里云高级技术专家李麟在Flink Forward Asia 2025新加坡站的分享，介绍了Flink 2.1 SQL在实时数据处理与AI融合方面的关键进展，包括AI函数集成、Join优化及未来发展方向，助力构建高效实时AI管道。

灵杰开发者

791 43 43

云技术达人

|

4月前

|

SQL 人工智能 JSON

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

本文整理自阿里云的高级技术专家、Apache Flink PMC 成员李麟老师在 Flink Forward Asia 2025 新加坡[1]站 —— 实时 AI 专场中的分享。将带来关于 Flink 2.1 版本中 SQL 在实时数据处理和 AI 方面进展的话题。

云技术达人

286 0 0

Flink 2.1 SQL：解锁实时数据与AI集成，实现可扩展流处理

技术自由圈/原疯狂创客圈

|

7月前

|

缓存 NoSQL 关系型数据库

美团面试：MySQL有1000w数据，redis只存20w的数据，如何做缓存设计？

美团面试：MySQL有1000w数据，redis只存20w的数据，如何做缓存设计？

技术自由圈/原疯狂创客圈

999 12 14

美团面试：MySQL有1000w数据，redis只存20w的数据，如何做缓存设计？

灵杰开发者

|

8月前

|

存储消息中间件 Kafka

基于 Flink 的中国电信星海时空数据多引擎实时改造

本文整理自中国电信集团大数据架构师李新虎老师在Flink Forward Asia 2024的分享，围绕星海时空智能系统展开，涵盖四个核心部分：时空数据现状、实时场景多引擎化、典型应用及未来展望。系统日处理8000亿条数据，具备亚米级定位能力，通过Flink多引擎架构解决数据膨胀与响应时效等问题，优化资源利用并提升计算效率。应用场景包括运动状态识别、个体行为分析和群智感知，未来将推进湖仓一体改造与三维时空服务体系建设，助力数字化转型与智慧城市建设。

灵杰开发者

815 3 4

基于 Flink 的中国电信星海时空数据多引擎实时改造

SelectDB

|

4月前

|

SQL 关系型数据库 Apache

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现，并结合 Flink CDC 详细介绍了整库同步的解决方案，助力构建更加高效、稳定的实时数据处理体系。

SelectDB

1786 0 0

从 Flink 到 Doris 的实时数据写入实践 —— 基于 Flink CDC 构建更实时高效的数据集成链路

云技术达人

|

5月前

|

存储消息中间件搜索推荐

京东零售基于Flink的推荐系统智能数据体系

摘要：本文整理自京东零售技术专家张颖老师，在 Flink Forward Asia 2024 生产实践（二）专场中的分享，介绍了基于Flink构建的推荐系统数据，以及Flink智能体系带来的智能服务功能。内容分为以下六个部分：推荐系统架构索引样本特征可解释指标 Tips：关注「公众号」回复 FFA 2024 查看会后资料～

云技术达人

348 1 1

京东零售基于Flink的推荐系统智能数据体系

小白学大数据

|

7月前

|

数据采集存储 NoSQL

基于Scrapy-Redis的分布式景点数据爬取与热力图生成

基于Scrapy-Redis的分布式景点数据爬取与热力图生成

小白学大数据

366 67 67

云流雨洄

|

6月前

|

存储缓存 NoSQL

告别数据僵尸！Redis实现自动清理过期键值对

在数据激增的时代，Redis如同内存管理的智能管家，支持键值对的自动过期功能，实现“数据保鲜”。通过`EXPIRE`设定生命倒计时、`TTL`查询剩余时间，结合惰性删除与定期清理策略，Redis高效维护内存秩序。本文以Python实战演示其过期机制，并提供最佳实践指南，助你掌握数据生命周期管理的艺术，让数据优雅退场。

云流雨洄

388 0 0

游客kufrkwrbkmpsa

|

9月前

|

Oracle 关系型数据库 Java

【YashanDB知识库】Flink CDC实时同步Oracle数据到崖山

本文介绍通过Flink CDC实现Oracle数据实时同步至崖山数据库（YashanDB）的方法，支持全量与增量同步，并涵盖新增、修改和删除的DML操作。内容包括环境准备（如JDK、Flink版本等）、Oracle日志归档启用、用户权限配置、增量日志记录设置、元数据迁移、Flink安装与配置、生成Flink SQL文件、Streampark部署，以及创建和启动实时同步任务的具体步骤。适合需要跨数据库实时同步方案的技术人员参考。

游客kufrkwrbkmpsa

273 1 1

【YashanDB知识库】Flink CDC实时同步Oracle数据到崖山

游客bhmgxanbwhyfe

|

9月前

|

缓存 NoSQL 关系型数据库

Redis和Mysql如何保证数据⼀致?

1. 先更新Mysql，再更新Redis，如果更新Redis失败，可能仍然不⼀致 2. 先删除Redis缓存数据，再更新Mysql，再次查询的时候在将数据添加到缓存中这种⽅案能解决1 ⽅案的问题，但是在⾼并发下性能较低，⽽且仍然会出现数据不⼀致的问题，⽐如线程1删除了 Redis缓存数据，正在更新Mysql，此时另外⼀个查询再查询，那么就会把Mysql中⽼数据⼜查到 Redis中 1. 使用MQ异步同步, 保证数据的最终一致性我们项目中会根据业务情况 , 使用不同的方案来解决Redis和Mysql的一致性问题 : 1. 对于一些一致性要求不高的场景 , 不做处理例如 : 用户行为数据 ,

游客bhmgxanbwhyfe

584 2 2

大数据与机器学习

实时计算 Flink

热门文章

最新文章

数据仓库介绍与实时数仓案例

实时计算 Flink SQL 核心功能解密

流计算StreamCompute

通过Flink实时构建搜索引擎的索引

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

流计算精品翻译: The Dataflow Model

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

Apache Flink 的迁移之路，2 年处理效果提升 5 倍

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

Delta Join：为超大规模流处理实现计算与历史数据解耦

打造可编程可集成的实时计算平台：阿里云实时计算 Flink被集成能力深度解析

流、表与“二元性”的幻象

Flink 智能调优：从人工运维到自动化的实践之路

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

Flink Agents 0.1.0 发布公告

阿里云、Ververica、Confluent 与 LinkedIn 携手推进流式创新，共筑基于 Apache Flink Agents 的智能体 AI 未来

Flink基于Paimon的实时湖仓解决方案的演进

Flink Agents：基于Apache Flink的事件驱动AI智能体框架

淘宝闪购基于Flink&Paimon的Lakehouse生产实践：从实时数仓到湖仓一体化的演进之路

相关产品

实时计算 Flink版

文档详情产品详情

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

Apache Flink 入门到实战 - Flink开源社区出品

实时计算 Flink 版产品入门与实操

开源 Flink 极速上手教程

大数据实时计算框架Spark快速入门

Apache Flink 入门

相关电子书

更多

Flink峰会 - 李佳林

Flink峰会 - 徐榜江

Flink CDC Meetup PPT - 龚中强

下一篇

阿里云负载均衡收费标准：ALB、NLB和CLB价格，包括LCU费用、实例费和公网带宽价格