文档备案控制台

开发者社区问答正文

基于 MaxCompute + Hologres 的人群圈选系统可以分成几种计算模式？

基于 MaxCompute + Hologres 的人群圈选系统可以分成几种计算模式？

展开

收起

芯在这 2021-12-12 21:03:57 931 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

真的很搞笑

标签过滤分为等值过滤，可以用Equal/In/Between，这些过滤可以在百亿级别上进行操作。操作之后的结果集，要做很多的交差并集，举个常见例子，一个用户既关注了竞品品牌也关注了本公司商品，却没有买，这里面其实有并的关系，有差的关系，有交的关系。所以这些人群关系之间要组合，有很高的交差并集计算。最后还有很强的精确去重的需求，因为最终要把计算结果，变成一个唯一定位用户的ID，这个ID会用来做广告的投递。那这些需求，在引擎层面上就是数据读取效率怎么样，如果用行存读取是不是会出现IO放大的问题，数据按行去存，真正过滤是按照某一列过滤，但是IO读取，会把整行读取，会出现IO放大问题。列存还会有索引问题、过滤效果问题。计算算子上表连接时是Hash JOIN方式还是用Nest Loop JOIN方式。精确去重的效果如何。这些都是对计算引擎效率上有很高的要求。所以本质上是要解决高效数据存储与过滤、关系运算内存/CPU消耗、精确去重内存/CPU消耗问题。

2021-12-12 21:04:36

赞同展开评论

问答分类：

分布式计算 MaxCompute 云原生大数据计算服务 MaxCompute 实时数仓 Hologres

问答标签：

云原生大数据计算服务 MaxCompute系统云原生大数据计算服务 MaxCompute计算云原生大数据计算服务 MaxCompute模式 maxcompute实时数仓 Hologres 实时数仓 Hologres系统

问答地址：

开发者社区 > 大数据 > 问答

相关问答

Hologres列存和行存两个模式（常用类型的字段）压缩比一般是多少？

207

1

0

hologres在slpm模式下有办法收回用户访问比如pg catalog等系统表的权限嘛？

227

1

0

MaxCompute刚入完数据，要过几秒才能通过hologres外表查询到数据

263

1

0

大数据软件领域有哪些新技术或引擎的出现，对Scan模式性能的提升有显著贡献？

198

1

0

如何使用PolarDB-X的全局CDC功能将数据同步到下游的大数据系统？

167

1

0

Hologres是否可以直接替代 PostgreSQL 用于业务系统？

453

2

0

大数据计算MaxCompute存的内部表，存储空间收费是按照oss系统进行收费的吗？

156

2

0

hologres内之前没有开过宽容模式的都需要新建表无状态重启是么？

139

3

0

阿里云Hologres如何对接MaxCompute？

220

1

0

如何在vvp作业中计算每个用户的累积消费金额，并将结果插入到Hologres表中？

117

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

内存被通义灵码吃光了。我电脑总共48G的内存，被通义灵码吃掉了30几G，你们搞什么飞机？

我下载的gguf文件，最新的LMSTUDIO仍然无法识别什么问题

CoPAW配置后，对话，出现 AGENT_UNKNOWN_ERROR 如何解决

copaw安装后，出现这个情况，在设置模型的过程中出现这个问题，如何解决

Qwen OpenAI-Responses 兼容模式有问题

相关文章

Dataphin功能Tips系列（92）如何方便快速地通过SQL取数实现定制化数据同步

别再把大数据平台当“巨石”了：聊聊云原生时代的大数据平台怎么活得更久

Spark / Flink 跑在 Kubernetes 上真的更香吗？聊聊那些没人提前告诉你的性能坑

阿里云第九代ECS云服务器（c9i、g9i、r9i）CPU采用Intel® Xeon® Granite Rapids处理器，主频3.2 GHz

别再盲目上 Serverless 了：聊聊 Serverless 数据分析的真相、成本和适用场景

相关解决方案

更多

构建视频直播系统

Flink 与 Hologres 搭建实时数仓

MetaGPT 构建多智能体协作系统

极速构建实时全文检索系统

LightRAG：轻量级知识图谱RAG系统

还有其他疑问?