MaxCompute问答整理之2020-06月-阿里云开发者社区

开发者社区> 阿里巴巴大数据计算> 正文

MaxCompute问答整理之2020-06月

简介: 飞天大数据平台计算引擎MaxCompute成为全球首个TPCx-BB认证的公共云产品,是除Hive、Spark以外TPCx-BB第三个标准支持的大数据引擎。

问题一、MaxCompute的表有无索引?
没有索引,不过Hash Clustering可以提供类似数据库里cluster index的效果。
具体可参考:https://help.aliyun.com/document_detail/73768.html

问题二、DataWorks调度依赖关系中,两个不同业务流程的节点如何依赖?
比如我们有两个业务流程A和B,可以让B业务流程首个节点依赖A业务流程的最后一个节点。
具体可参考:https://developer.aliyun.com/article/759463

问题三、MaxCompute时间类型字段能不能不带时分秒?
可以使用date数据类型。开启MaxCompute2.0可以使用date类型。
具体可参考:
https://help.aliyun.com/document_detail/159541.html

问题四、请问删除表的所有数据sql怎么写?
可以通过删除(DROP)表达到数据删除目的。
非分区表可以通过TRUNCATE TABLE table_name;语句清空表数据。
分区表可以通过ALTER TABLE table_name DROP IF EXISTS PARTITION(分区名=‘具体分区值’)删除分区达到删除整个分区数据的目的。
具体可参考 :
https://help.aliyun.com/knowledge_detail/150534.html

问题五、请问有什么办法快速查看项目空间下哪些表是分区表?

select table_name  from information_schema.columns where is_partition_key = true group by table_name;

问题六、新创建的工作空间。怎么不支持数据类型自动隐式转换呢?
看下是否开启了MaxCompute2.0,可以关闭2.0之后可进行隐式转换。
具体可参考:https://help.aliyun.com/document_detail/57792.html

问题七、spark odps流式读取datahub数据,写到odps有没有参考文档或者代码?
可参考:https://github.com/aliyun/MaxCompute-Spark/tree/master/spark-2.x/src/main/scala/com/aliyun/odps/spark/examples/streaming/datahub

问题八、怎么将开发环境的表数据同步到生成环境的表中?

insert into project.table  select * from project_dev.table;

如果没有对生产环境表读写权限,对子账户需要授权grant role to $RAM:User;

问题九、可以使用tableau连接MaxCompute吗?
可以。具体可参考:
https://help.aliyun.com/document_detail/115493.html

问题十、 查询一个分区表 where条件是add_months('2020-06-01',-1) ,报错:is full scan with all partitions, please specify partition predicates. 怎么解决呢?
可以通过explain命令查看SQL中的分区剪裁是否生效。
具体可参考:https://help.aliyun.com/document_detail/58679.html

欢迎扫码加入 MaxCompute开发者社区钉钉群,或点击 申请加入。

image.png

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
阿里巴巴大数据计算
使用钉钉扫一扫加入圈子
+ 订阅

阿里大数据官方技术圈

官方博客
链接