备案控制台

开发者社区大数据与机器学习实时计算 Flink 正文

实时写入与点查对于不同应用场景有怎么样的优化手段？

实时写入与点查对于不同应用场景有怎么样的优化手段？

展开

收起

Medusa 2021-11-12 16:15:21 406 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

云上静思

对于实时写入与点查的场景，首先要检查建表是否合适。对于高 QPS 写入以及点查来说，我们希望 Distribution Key 和查询条件一致。因为 Distribution Key 用来找到对应的Shard，在写入的 QPS 很高的情况下，假如过滤条件与分布 Key 一致，我们就可以快速路由到某一个 Shard 上面，这个查询就不需要发到所有 Shard 上，对这种场景有很大的性能提升，所以要求 Distribution Key 和查询条件一致。

第二个是我们的表最好是行存表，因为行存表对实时写入以及点查在性能上非常友好。

第三个场景是假设不是行存表而是列存表，我们希望 Pk、Clustering Key 和查询条件一致，这样才能用上 Clustering Index 的能力。

除了建表优化以外，还需要优化查询写入代码。因为如果写 Hologres 的代码设计得不合理，会带来非常高昂的额外成本。可能用户会发现 QPS 好像已经上不去了，但其实Hologres 内部 CPU 使用率非常低，这是因为用户自己的写入代码不是特别高效。

资料来源：《实时数仓“王炸组合”-实时计算》，下载链接：https://developer.aliyun.com/topic/download?id=7944

2021-11-12 18:34:47

赞同展开评论

问答分类：

实时计算 Flink版

问答地址：

开发者社区 > 大数据与机器学习 > 实时计算 Flink > 问答

相关问答

实时计算 Flink版

请问下我访问接口不通什么原因 Provisional headers are shown

2904

0

0

购买阿里国外的云服务器是否可以访问谷歌？

82251

47

0

通过www和不带www的网址输入最终都指向www.我的域名.com，求指教

131305

28

0

sql server的用户名和密码怎么查啊？

36699

21

0

this xml file does not appear to have any style in

50681

10

0

OSS的endpoint如何查看

37023

6

0

计算机网络的频带传输是什么意思？

2031

1

0

配置了安全组规则，端口还是无法访问

32905

25

0

域名在腾讯云备案成功，解析到阿里云服务器，提示仍需备案？

60282

30

0

手机弹出支付风险问题

6830

2

0

大数据与机器学习

实时计算 Flink

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务，基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎，提高作业开发运维效率。

我要提问

收录在圈子:

阿里云实时计算Flink

199214

+ 订阅

实时计算 Flink 版（Alibaba Cloud Realtime Compute for Apache Flink，Powered by Ververica）是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统，由 Apache Flink 创始团队官方出品，拥有全球统一商业化品牌，完全兼容开源 Flink API，提供丰富的企业级增值功能。

相关文章

云栖实录｜实时计算 Flink 全新升级 - 全栈流处理平台助力实时智能

实时计算 Flink 全新升级 - 全栈流处理平台助力实时智能

理想汽车基于 Hologres + Flink 构建万亿级车联网信号实时分析平台

云栖实录｜驰骋在数据洪流上：Flink+Hologres驱动零跑科技实时计算的应用与实践

Flink 智能调优：从人工运维到自动化的实践之路

热门讨论

热门文章

Flink CDC任务从savepoint/checkpoints状态中恢复作业错误问题

Flink1.17为什么需要JDK 11呢？JDK8我试了也能运行

FlinkCDC MySQL 中 scan.startup.mode 用的是什么模式啊？

Flink CDC中，有哪位大佬有flink 版本和cdc版本的适配统计啊？

有大佬遇到过flink web ui上的指标都是loading状态吗，flink版本是1.17.1？

Flink的tmp的这个目录产生临时文件很大，我想配置到外面，有配置项可以配置吗？

Flink CDC里用jdbc往达梦dm8推数据，老是显示字符被截断是咋回事？有人碰到过嘛？

Flink的集群模式区别，有何优缺点

Flink有2023 Flink Forward Asia 资料下载地址吗?

大佬们，flink cdc如何集成达梦数据库？或者有没有解决方案？

展开全部

独家专访阿里集团副总裁贾扬清：我为什么选择加入阿里巴巴？

Flume+Kafka+Flink+Redis构建大数据实时处理系统：实时统计网站PV、UV展示

阿里云实时计算产品案例&解决方案汇总

流计算精品翻译: The Dataflow Model

接着！！Apache Flink 全领域干货合集（持续更新）

Flink SQL 功能解密系列 —— 流式 TopN 挑战与实现

为什么说流处理即未来？

基于实时计算（Flink）打造一个简单的实时推荐系统

Flink Checkpoint 问题排查实用指南

Flink SQL 功能解密系列 —— 流计算“撤回(Retraction)”案例分析

展开全部

还有其他疑问?