文档备案控制台

开发者社区数据库正文

咨询下多表关联后,少数据的那张表进行sum的时候数据会变多,这种是怎么解决的

咨询下多表关联后,少数据的那张表进行sum的时候数据会变多,这种是怎么解决的

展开

收起

游客3oewgrzrf6o5c 2022-08-10 17:15:01 573 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

阿里云 AI 助理回答

当您在多表关联后进行求和(SUM)操作时，如果发现数据量少的表在求和时数据异常增多，这通常是因为关联字段存在重复值导致的数据膨胀。解决这一问题的方法如下：

检查关联字段：确认用于关联的字段（如item_id）在参与关联的表中是否存在重复值。这是导致数据膨胀进而影响求和结果的主要原因。
去重处理：在创建数据集或编写SQL查询时，对涉及关联的字段执行去重操作。例如，可以使用DISTINCT关键字或者通过子查询先去除重复记录，再进行关联操作。示例SQL片段如下：
```
SELECT 
 t1.field1, 
 SUM(DISTINCT t2.field2) AS sum_value
FROM table1 t1
JOIN (SELECT DISTINCT item_id, field2 FROM table2) t2
ON t1.item_id = t2.item_id
GROUP BY t1.field1;
```
优化关联逻辑：如果数据倾斜是由于某些热点键值引起，可以考虑采用策略来分散这些热点，比如为非热点值保持原样，而对热点值附加随机数后再进行关联，但这种方法会较大地修改原有业务逻辑，需谨慎使用。
避免直接在关联表上求和：可以先单独对每张表进行必要的聚合操作（如分组求和），去除重复计数的影响，然后再进行表的关联。这样可以确保求和是在去重后的数据基础上进行的。
使用特定工具或设置防倾斜参数：对于特定场景，如在大数据处理平台如MaxCompute上，可以通过设置特定参数来应对Group By产生的数据倾斜问题，如设置odps.sql.groupby.skewindata=true来启用防倾斜功能。

综上所述，解决多表关联后求和数据异常增多的问题主要集中在确保关联字段无重复、合理设计关联与聚合顺序，以及根据实际情况选择合适的优化策略。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答地址：

开发者社区 > 数据库 > 问答

相关问答

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

136611

16

0

#支付宝身份验证失败（人气大爆发，一会再试试）？

11173

2

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

268422

11

0

#支付宝授权提示请在支付宝客户端打开链接

18848

19

0

购买阿里国外的云服务器是否可以访问谷歌？

87372

49

0

this xml file does not appear to have any style in

54998

11

0

今天刚刚买的阿里云香港服务器，国内无法访问，坑啊

35663

17

0

哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀？

3126

18

0

轻量级应用服务器端口问题（打不开）

32326

21

0

阿里云香港服务器在哪购买？香港云服务器购买流程有吗？

8283

5

0

数据库

数据库领域前沿技术分享与交流

我要提问

收录在圈子:

阿里云数据库

279463

+ 订阅

让用户数据永远在线，让数据无缝的自由流动

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

多模态数据信息提取

数据守护：防勒索攻击数据保障

高效存储和处理多媒体数据

热门讨论

热门文章

游戏行业细分场景与解决方案中提及的“买量”是什么意思？

数据传输DTS目标端AnalyticDB同步DDL为什么失败？

升级PolarDB 8.0.2以后，视图授权好的，被授权用户查询的时候为什么还是提示没有权限？

DBS数据库备份配置的RDS生命周期需要和OSS的生命周期保持一致吗？

数据传输DTS的Azure mysql pass到Ali RDS mysql的迁移只能走公网吗？

dms是什么啊？

请问OceanBase桌面版 ODC中，怎么设置oracle租户sql查询date数据的显示格式

聊一聊你眼中的Data Agent，它能帮我们完成什么？

数据传输DTS rds同步到es 可以多张表汇聚成同一个索引吗？

DBS数据库备份的全量备份，是不是一周一次就差不多了哦？

展开全部

ETCD系列之一：简介

阿里云分析引擎Spark On 多数据源介绍

德哥的PostgreSQL私房菜 - 史上最屌PG资料合集

什么场景应该用 MongoDB ？

PostgreSQL 如何实现批量更新、删除、插入

MongoDB Sharded cluster架构原理

Redis Stream——作为消息队列的典型应用场景

MongoDB 生态 - 可视化管理工具

DRDS 数据恢复重磅发布，全方位保障您的数据安全

PostgreSQL upsert功能(insert on conflict do)的用法

展开全部

还有其他疑问?