文档备案控制台

开发者社区问答正文

[@小川游鱼][¥20]大数据环境中，根据一张表（idList）的数据去修改另一张表的数据(id_label),有没有比较高效的方法？

现在有一个类似的需求，在cloudera环境中，是根据一个表的数据去更新另一个表的对应的行的某个字段。

如在hive中有：

表A（字段有一个，为id），对应数据为（1,2）;

表B（字段有两个，分别为 id:label），对应数据为（1:N,2:N,3:N,4:N）;

现在根据需求,需要将表B中id在表A中的数据更新。

更新后表B数据应为（1:Y,2:Y,3N,4:N）

现在已经有的实现是在hive中直接通过sql做修改，但是效率很低，想问下这类问题在大数据环境中有没有更好的解决方法（如通过其他工具，现在考虑将修改的操作移回ORACLE数据库做处理），或者在hive是否有方法能对这个更新操作的效率做优化。

现在在hive的sql为update A set label ='Y' where A.id in (select id from B);

希望大大提供下思路，谢谢了

展开

收起

晓生寒 2018-12-14 16:15:42 2524 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

fuxt

不要用 a.id in (...)
改为
select
case when A.id is not null then 'Y' end
from B left outer join A on B.id = A.id

2019-07-17 23:21:07

赞同展开评论

问答分类：

SQL Oracle 大数据关系型数据库数据库 HIVE 云原生大数据计算服务 MaxCompute

问答标签：

云原生大数据计算服务 MaxCompute数据云原生大数据计算服务 MaxCompute环境云原生大数据计算服务 MaxCompute方法云原生大数据计算服务 MaxCompute环境数据云原生大数据计算服务 MaxCompute环境方法

问答地址：

开发者社区 > 数据库 > 问答

相关问答

大数据计算MaxCompute有方法查询很多表的最大分区么?

198

0

0

在ODPS环境中，如何进行Spark的交互式开发测试？

231

1

0

大数据计算MaxCompute的datawork下面每个sql执行系统环境哪里可以配置？

259

1

0

如果要让大数据计算MaxCompute快一点还能有啥好的方法？

203

0

0

MaxCompute的python udf如何在mac环境下配置创建

203

1

0

MaxCompute grant怎么对正式环境授权

145

0

0

如何通过VPC网络环境机器访问MaxCompute项目

181

1

0

大数据计算MaxCompute实例，一个在金融云，一个在公有云。有什么简单方便的方法吗？

151

1

0

如何用一台服务器搭建大数据环境

276

0

0

大数据计算MaxCompute这个问题帮忙看下，好像是python环境问题引起的？

166

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

qoder CN,wiki收费为什么没有提示,以前qoder国际版不是免费的吗,一次跑了几百Cred

阿里云服务器官网在哪？有几种云服务器类型？

阿里云服务器多少钱一年？价格贵不贵？有优惠吗？

阿里云服务器问题解答，你关心的问题都在这！

阿里云 ECS 公网 IP有什么更换技巧？

相关文章

电商平台数据库TDE透明加密实战：防数据泄露+合规一次过

当 80% 的数据库由 AI 自动创建，我们需要一个什么样的 PostgreSQL？

Kolla-Ansible 部署 OpenStack + Ceph 完整方案

AI时代的知识重构：Google Cloud OKF规范如何破解RAG痛点，重塑Agent知识库协作

2026阿里云最新云产品活动信息汇总：优惠券、特价、扶持政策一览

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

高效存储和处理多媒体数据

多模态数据信息提取

数据守护：防勒索攻击数据保障

还有其他疑问?