MaxCompute问答整理之2020-06月

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介: 飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。

问题一、MaxCompute的表有无索引?
没有索引,不过Hash Clustering可以提供类似数据库里cluster index的效果。
具体可参考:https://help.aliyun.com/document_detail/73768.html

问题二、DataWorks调度依赖关系中,两个不同业务流程的节点如何依赖?
比如我们有两个业务流程A和B,可以让B业务流程首个节点依赖A业务流程的最后一个节点。
具体可参考:https://developer.aliyun.com/article/759463

问题三、MaxCompute时间类型字段能不能不带时分秒?
可以使用date数据类型。开启MaxCompute2.0可以使用date类型。
具体可参考:
https://help.aliyun.com/document_detail/159541.html

问题四、请问删除表的所有数据sql怎么写?
可以通过删除(DROP)表达到数据删除目的。
非分区表可以通过TRUNCATE TABLE table_name;语句清空表数据。
分区表可以通过ALTER TABLE table_name DROP IF EXISTS PARTITION(分区名=‘具体分区值’)删除分区达到删除整个分区数据的目的。

问题五、请问有什么办法快速查看项目空间下哪些表是分区表?

select table_name  from information_schema.columns where is_partition_key = true group by table_name;

问题六、新创建的工作空间。怎么不支持数据类型自动隐式转换呢?
看下是否开启了MaxCompute2.0,可以关闭2.0之后可进行隐式转换。
具体可参考:https://help.aliyun.com/document_detail/57792.html

问题七、spark odps流式读取datahub数据,写到odps有没有参考文档或者代码?
可参考:https://github.com/aliyun/MaxCompute-Spark/tree/master/spark-2.x/src/main/scala/com/aliyun/odps/spark/examples/streaming/datahub

问题八、怎么将开发环境的表数据同步到生成环境的表中?

insert into project.table  select * from project_dev.table;

如果没有对生产环境表读写权限,对子账户需要授权grant role to $RAM:User;

问题九、可以使用tableau连接MaxCompute吗?
可以。具体可参考:
https://help.aliyun.com/document_detail/115493.html

问题十、 查询一个分区表 where条件是add_months('2020-06-01',-1) ,报错:is full scan with all partitions, please specify partition predicates. 怎么解决呢?
可以通过explain命令查看SQL中的分区剪裁是否生效。
具体可参考:https://help.aliyun.com/document_detail/58679.html

欢迎扫码加入 MaxCompute开发者社区钉钉群,或点击 申请加入。

image.png

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
6月前
|
SQL 分布式计算 DataWorks
MaxCompute产品使用合集之该怎么创建MaxCompute的项目
MaxCompute作为一款全面的大数据处理平台,广泛应用于各类大数据分析、数据挖掘、BI及机器学习场景。掌握其核心功能、熟练操作流程、遵循最佳实践,可以帮助用户高效、安全地管理和利用海量数据。以下是一个关于MaxCompute产品使用的合集,涵盖了其核心功能、应用场景、操作流程以及最佳实践等内容。
|
SQL 存储 分布式计算
MaxCompute问答整理之2020-04~05月
飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。
797 0
MaxCompute问答整理之2020-04~05月
|
SQL 分布式计算 Java
MaxCompute问答整理之2020-03月
飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。
1113 0
MaxCompute问答整理之2020-03月
|
SQL 分布式计算 Cloud Native
MaxCompute问答整理之2020-02月
飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。
1252 0
MaxCompute问答整理之2020-02月
|
SQL 存储 分布式计算
MaxCompute问答整理之2020-01月
本文是基于本人对MaxCompute产品的学习进度,再结合开发者社区里面的一些问题,进而整理成文。希望对大家有所帮助。
1260 0
MaxCompute问答整理之2020-01月
|
SQL 消息中间件 JSON
MaxCompute问答整理之12月
本文是基于本人对MaxCompute产品的学习进度,再结合开发者社区里面的一些问题,进而整理成文。希望对大家有所帮助。
1485 0
MaxCompute问答整理之12月
|
SQL 分布式计算 Oracle
MaxCompute问答整理之11月
本文是基于本人对MaxCompute产品的学习进度,再结合开发者社区里面的一些问题,进而整理成文。希望对大家有所帮助。
6823 0
MaxCompute问答整理之11月
|
分布式计算 MaxCompute SQL
MaxCompute问答整理之8月
本文是基于对MaxCompute产品的学习进度,再结合开发者社区里面的一些问题,进而整理成文。希望对大家有所帮助。
2630 0
|
SQL Web App开发 分布式计算
MaxCompute使用常见问题总结
Maxcompute常见问题的总结,方便广大用户可以快速排查问题
5300 0
|
SQL 分布式计算 大数据
MaxCompute基础与MaxCompute SQL优化
总论:大数据计算服务 ( MaxCompute,原名 ODPS ) 是一种快速、完全托管的 TB/PB 级数据仓库解决方案 。MaxCompute 向用户提供了完善的数据导入方案以及多种经典的分布式计算模型,能够更快速的解决用户海量数据计算问题,有效降低企业成本,并保障数据安全 。
7536 0

相关产品

  • 云原生大数据计算服务 MaxCompute