备案控制台

开发者社区大数据与机器学习大数据计算 MaxCompute 文章正文

MaxCompute产品使用合集之启用hive兼容的时候，某个字段是null，是否会把这个字段当成空白连起来

2024-06-10 234

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： MaxCompute作为一款全面的大数据处理平台，广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践，可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集，涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。

问题一：大数据计算MaxCompute我开启了hive兼容,但是这个和hive、spark的有差异，为什么？

大数据计算MaxCompute我开启了hive兼容,但是这个和hive、spark的有差异，这个函数我其它两个产品都用过，别人都是连起来的字段如果中间某个字段是null，是用空白替换，整个字段数量是不变的，结果MC这里导致字段数量少了，非得加nvl判断下。。。

参考答案：

看错了。是有匹配的。 hive的concat对应的是MaxCompute的concat。我试了一下。hive返回的也是null

MaxCompute里面加不加hive兼容都是返回null

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/574951

问题二：大数据计算MaxCompute 会不把这个字段当成空白连起来吗？

大数据计算MaxCompute concat_ws 启用hive兼容的时候，某个字段是null，会不把这个字段当成空白连起来吗？我链接4个字段，其中有个字段是null，结果出来的结果是3个值，那个null的居然没用当成空白连起来，是这样子吗？

参考答案：

应该返回null ，

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/574950

问题三：大数据计算MaxCompute dataworks 统计时候缺少nvl函数怎么处理？

大数据计算MaxCompute dataworks 统计时候缺少nvl函数怎么处理？

参考答案：

https://help.aliyun.com/zh/maxcompute/user-guide/nvl?spm=a2c4g.11174283.0.i1

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/574948

问题四：大数据计算MaxCompute看起来好像又不是，单个都是1分钟多,他们不是完全并行的？

大数据计算MaxCompute看起来好像又不是，单个都是1分钟多,他们不是完全并行的？

参考答案：

在MaxCompute中，任务（Task）是其基本计算单元，所有的SQL和MapReduce功能都是通过任务来完成的。每个任务在被提交后，MaxCompute会对其进行解析以生成任务的执行计划。

尽管MaxCompute的设计初衷是为了实现并行处理以提高运算效率，但在实际运行中，由于存在任务间的依赖关系，因此并不是所有任务都能完全并行执行。一个任务的开始运行可能需要等待其依赖的任务先运行完成。这种任务间的依赖性可能会影响到整体的执行效率，使得单个任务的执行时间增加。

此外，根据实际生产项目的经验，即使是计算量较大的任务，其执行时间（包括等待时间和真正运行时间）通常也不会超过1个小时。对于使用spark等类型的作业，如果一个job启动时间较长，也是正常现象。

总的来说，虽然MaxCompute设计上支持并行处理，但由于任务间的依赖关系和特定任务类型的特性，可能会导致单个任务的执行时间超过预期。同时，也需要注意监控和管理任务的状态，以确保任务能够顺利执行并及时获取任务的执行进度。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/574947

问题五：大数据计算MaxCompute我点击logview上的M 任务，他只是显示一个total的，是吗？

大数据计算MaxCompute我点击logview上的M 任务，他只是显示一个total的，你的意思是其底层的5个instance分别的读取速度不一，是吗？

参考答案：

是的

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/574946

文章标签：

云原生大数据计算服务 MaxCompute

分布式计算

MaxCompute

SQL

HIVE

大数据

关键词：

云原生大数据计算服务 MaxCompute产品

字段null

云原生大数据计算服务 MaxCompute hive

产品Hive

云原生大数据计算服务 MaxCompute字段

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

三分钟热度的鱼

目录

相关文章

阿里云大数据Al技术

|

4月前

|

人工智能分布式计算 DataWorks

大数据AI产品月刊-2025年7月

大数据& AI 产品技术月刊【2025年7月】，涵盖7月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

阿里云大数据Al技术

532 0 0

xxrjl

|

3月前

|

人工智能分布式计算 DataWorks

阿里云大数据AI产品月刊-2025年8月

阿里云大数据& AI 产品技术月刊【2025年 8 月】，涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

xxrjl

322 2 2

阿里云大数据Al技术

|

6月前

|

人工智能分布式计算 DataWorks

大数据& AI 产品月刊【2025年5月】

大数据& AI 产品技术月刊【2025年5月】，涵盖5月技术速递、产品和功能发布、市场和客户应用实践等内容，帮助您快速了解阿里云大数据& AI 方面最新动态。

阿里云大数据Al技术

397 59 59

青云交（Java大数据AI云原生Python）

|

5月前

|

存储搜索推荐算法

Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用（195）

本文深入探讨了Java大数据技术在智能金融理财产品风险评估与个性化配置中的关键应用。通过高效的数据采集、存储与分析，Java大数据技术助力金融机构实现精准风险评估与个性化推荐，提升投资收益并降低风险。

青云交（Java大数据AI云原生Python）

236 0 0

Java 大视界 -- Java 大数据在智能金融理财产品风险评估与个性化配置中的应用（195）

蓝易云

|

5月前

|

SQL Java 数据库连接

updateByPrimaryKeySelective()方法因字段为null导致的更新不成功问题解决办法

为了让这个解决方案更容易融入到现有系统中，其实现应该尽量简单且无缝，避免重复代码，并提高代码复用性。结合上述方法中提供的策略，应可以解决在使用 `updateByPrimaryKeySelective()`方法时因字段为null导致的更新不成功问题。请根据实际业务需求和上下文选择最合适的方案。这样的解决方案能够达到更佳的代码质量和维护性。

蓝易云

439 14 14

Echo_Wish

|

3月前

|

机器学习/深度学习传感器分布式计算

数据才是真救命的：聊聊如何用大数据提升灾难预警的精准度

数据才是真救命的：聊聊如何用大数据提升灾难预警的精准度

Echo_Wish

225 14 14

1062754335

|

5月前

|

数据采集分布式计算 DataWorks

ODPS在某公共数据项目上的实践

本项目基于公共数据定义及ODPS与DataWorks技术，构建一体化智能化数据平台，涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理，强化数据安全与流通，提升业务效率与决策能力，助力数字化改革。

1062754335

176 4 4

Echo_Wish

|

4月前

|

机器学习/深度学习运维监控

运维不怕事多，就怕没数据——用大数据喂饱你的运维策略

运维不怕事多，就怕没数据——用大数据喂饱你的运维策略

Echo_Wish

169 0 0

大数据与机器学习

大数据计算 MaxCompute

热门文章

最新文章

大数据环境下该如何优雅地设计数据分层

MaxCompute执行作业慢的原因排查

阿里云MaxCompute（大数据）公开数据集---带你玩转人工智能

优酷背后的大数据秘密

【大数据干货】轻松处理每天2TB的日志数据，支撑运营团队进行大数据分析挖掘，随时洞察用户个性化需求。

【转载】时隔一年多，我又用起了 Superset

品《阿里巴巴大数据实践-大数据之路》一书（上）

使用 MaxCompute Studio 开发大数据应用

阿里数据仓库实践分享

网站代码网站源代码网页源代码网页代码网站

【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert：大数据数据流写业务迁移的实践与突破

【跨国数仓迁移最佳实践7】基于 MaxCompute 多租的大数据平台架构

ODPS 十五周年实录 | Data + AI，MaxCompute 下一个15年的新增长引擎

【跨国数仓迁移最佳实践6】MaxCompute SQL语法及函数功能增强，10万条SQL转写顺利迁移

诊断设备企业必看！垂直医疗行业的CRM软件有哪些？

MaxCompute 聚簇优化推荐原理

【跨国数仓迁移最佳实践5】MaxCompute近线查询解决方案助力物流电商等实时场景实现高效查询

【赵渝强老师】阿里云大数据MaxCompute的体系架构

MaxCompute聚簇优化推荐功能发布，单日节省2PB Shuffle、7000+CU！

相关产品

云原生大数据计算服务 MaxCompute

文档详情产品详情

相关课程

更多

大数据Spark2020最新课程（知识精讲与实战演练）第二阶段

大数据Spark2020版（知识精讲与实战演练）第三阶段

大数据Spark2020版（知识精讲与实战演练）第四阶段

2020版大数据实战项目之DMP广告系统（第五阶段）

2020版大数据实战项目之DMP广告系统（第六阶段）

2020版大数据实战项目之DMP广告系统（第七阶段）

相关电子书

更多

MaxCompute Serverless 架构演进

Data+AI时代大数据平台应该如何建设

大数据AI一体化的解读

下一篇

对象存储OSS快速上手——如何使用ossbrower2