备案控制台

开发者社区> 问答> 正文

将Apache Flink中的关系数据存储为状态并通过属性查询

我有一个包含表T1（id，name，age）和T2（id，subject）的数据库。Flink使用诸如debezium之类的东西从事件流接收来自数据库的所有更新。这些表被彼此相关的和所需的数据可以由被提取接合 T1与T2上的id。目前，数据库的整个状态存储在Flink MapState中，其中id为密钥。现在的问题是，我需要选择基于行的名字从T1不使用的ID。好像我需要T1上的索引（名字）使它更快。有没有什么方法可以自动索引它，而无需为每个表手动创建索引。这样做的推荐方法是什么？我知道表上的SQL流，但我需要支持表的更新。顺便说一下，我使用Flink和Scala。

展开

收起

flink小助手 2018-12-13 14:15:18 3637 0

1 条回答

写回答

取消提交回答

flink小助手

flink小助手会定期更新直播回顾等资料和文章干货，还整合了大家在钉群提出的有关flink的问题及回答。

我的理解是你连接T1和T2，并存储一些表示（在MapState中）来自这两个流的键控状态的数据，由id键入。听起来T1和T2随着时间的推移而发展，并且您希望能够通过指定名称随时以交互方式查询联接。
一种想法是以您想要选择的名称进行广播，并使用KeyedBroadcastProcessFunction来处理它们。在其processBroadcastElement方法中，您可以使用ctx.applyToKeyedState通过从MapState记录中提取数据来计算结果（必须在此运算符中保存）。我怀疑你会想要使用这些名称作为这些MapState记录中的键，这样你就不必迭代每个map中的所有条目来找到感兴趣的项目。

2019-07-17 23:20:36

赞同展开评论打赏

问答分类：

存储 SQL Apache Scala 数据库流计算索引实时计算 Flink版

问答标签：

Apache查询 Apache属性实时计算 Flink版查询实时计算 Flink版属性 Apache flink

问答地址：

开发者社区 > 数据库 > 问答

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

Flink CDC里这个是字段属性类型问题吗?

14

0

0

Flink CDC 里source支持debezium.table.exclude.list属性吗？

38

1

0

Flink CDC 里整库同步的时候要排除表需要怎么配置？我设置debezium属性没有效果怎么办？

40

0

0

Flink的s connector 连接器 socket.timeout 属性配置不了？

35

3

0

各位有没有遇到过spark sql查询hudi 数据时没有办法查到flink cdc ？

45

2

0

有什么办法让flink只查询cache的数据？

45

2

0

flink1.18, oracle cdc 2.4。按照官网教程执行查询报错怎么办？

11

1

0

Flink告警界面可以查询到是谁操作的吗？

13

1

0

Flink使用滑动窗口时报这个错，这个函数的参数有什么限制吗？必须有时间属性？

17

1

0

flink-cdc-mysql2.3和2.4能支持只做全量查询，然后结束任务吗？有这种参数配置吗？

12

0

0

问答排行榜

最热

最新

1 通过阿里云代备案系统进行个人快速备案 2699595

2 【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥 1818188

3 据说在家办公的程序员是这样写代码的？ 1792139

4 阿里云开放端口权限 689809

5 《阿里云服务器从入门到精通》—论坛精华帖汇总（2013.8.21更新） 599378

6 如何升级配置 536028

7 【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？ 522326

8 【精品问答】python技术1000问(1) 513948

9 Flink Forward Asia 2021 有奖问答 512768

10 Linux Bash严重漏洞修复紧急通知（已全部给出最终修复方案） 456894

11 OceanBase 使用动画（持续更新） 359229

12 阿里云LNAMP(Linux + Nginx + Apache + MySQL + PHP)环境一键安装脚本 329688

13 OSS存储服务-客户端工具 321251

14 为体验实验室取一个新名字。 307177

15 企业邮箱发送邮件时，若出现投递失败产生退信，内容提示包含如下： the mta server of * reply:550 failed to meet SPF requirements 或者 the mta server of 163.com — 163mx01.mxmail.netease.com(220.181.14.141) reply:550 MI:SPF mx14,QMCowECpA0qTiftVaeB3Cg—.872S2 1442548128 http://mail.163.com/help 303687

16 Win Server 2003-2016 加密勒索事件必打补丁合集 295098

17 FLASH播放器，在IE浏览器下显示请确定您的域名已完成备案和CNAME绑定 283471

18 安全组详解，新手必看教程 277228

19 写code还是做管理，开发者如何进行职业规划？ 268276

20 惊喜翻倍：免费ECS+免费环境配置~！(ECS免费体验6个月活动3月31日结束) 255811

1 如何从零构建一个现代深度学习框架? 315

2 AI面试成为线下面试的“隐形门槛”，对此你怎么看？ 525

3 乘风问答官5月排位赛开启！ 369

4 你见过哪些独特的代码注释？ 1366

5 你遇到过哪些触发NPE的代码场景？ 849

6 宜搭中，线上答题单选题和多选题在一起如何计算总分，请老师指点 181

7 宜搭中，在表单里复选选项（搭建多选题）如何设置单行文本自动获取“你的答案”所选的选项如“AB” 137

8 宜搭流程表单怎样根据连接器返回值阻止提交 170

9 如何让系统具备良好的扩展性？ 1900

10 在JS编程中有哪些常见的编程“套路”或习惯？ 1524

11 表单新加了个字段A，历史数据要添加字段A的值问题 373

12 nacos部署需要开放哪几个端口？ 202

13 在做程序员的道路上，你掌握了什么关键的概念或技术让你感到自身技能有了显著飞跃？ 2054

14 作为一个经典架构模式，事件驱动在云时代为什么会再次流行呢？ 1842

15 如何实现主表单内数字组件自动获取子表单内数据条数 143

16 宜搭：提交表单前，如何校验另一张表单的数据？ 409

17 如何实现自动计算请假天数并自动跳过法定节假日？ 105

18 Windows 11系统电脑自动重启后，vscode启动通义灵码插件报错：此应用无法在你的电脑上运行 205

19 如何看待首个 AI 程序员入职科技公司？ 2399

20 未启用对服务器的访问 588

相关课程

更多

大数据Flink实时旅游平台环境篇 2020版

582

29

去学习

Apache Flink 入门到实战 - Flink开源社区出品

1392

16

去学习

实时计算 Flink 版产品入门与实操

3806

10

去学习

开源 Flink 极速上手教程

1752

7

去学习

大数据实时计算框架Spark快速入门

778

93

去学习

Apache Flink 入门

4826

9

去学习

推荐问答

乘风问答官招募中！机械键盘免费拿

相关电子书

更多

Flink CDC Meetup PPT - 龚中强 立即下载

Flink CDC Meetup PPT - 王赫 立即下载

Flink CDC Meetup PPT - 覃立辉 立即下载

相关实验场景

更多