阿里云 MaxCompute 2020-2 月刊-阿里云开发者社区

阿里云 MaxCompute 2020-2 月刊

2020-03-05 5298

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

云原生大数据计算服务 MaxCompute，5000CU*H 100GB 3个月

云原生大数据计算服务MaxCompute，500CU*H 100GB 3个月

简介： MaxCompute2020年2月刊为您带来Python UDF 支持Python 3 ，MaxCompute存储格式全面升级AliORC等九项最新发布功能。欢迎阅读。

亲爱的开发者， MaxCompute 2020.2月刊已为您准备妥当。本次内容将为您带来2020年2月 MaxCompute 9项重要的功能发布，欢迎详细阅读并结合业务进行实践，任何问题可以加入“MaxCompute开发者社区”进行咨询，社区钉钉群二维码请见文末。

1.【新功能】MaxCompute存储格式全面升级AliORC

MaxCompute推出了自研的大数据列存储格式AliOrc，无论是读写性能，还是数据压缩存储空间，都有明显的提升。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute存储格式升级到AliOrc，客户无需干预，自动升级并提高读写性能。

2.【新功能】 Python UDF 支持Python 3 查看文档 >>>

Python 2 官方即将停止维护，越来越多的三方库也开始只支持 Python 3，MaxCompute也开启Python3的支持。

适用客户
MaxCompute公共云客户

发布功能
Python UDF 支持Python 3的编译和运行环境。

3.【新功能】Tunnel upload sdk 支持 overwrite的 ddl 语义 查看文档 >>>

Tunnel SDK的 UploadSession支持overwirte设置。

适用客户
MaxCompute公共云客户

发布功能
Tunnel SDK的 UploadSession类的createUploadSession方法中增加了overwrite设置，支持客户指定tunnel写入数据时覆盖表/分区中的现有数据。

4.【新功能】SQL中列名书写错误的智能纠错提示

更加丰富智能的语法检查，提高了SQL开发的调试效率。

适用客户
MaxCompute公共云客户

发布功能
SQL运行中，当字段名错误时，MaxCompute将猜测并提示正确的字段名。

5.【新功能】外表支持 MSCK REPAIR TABLE语法 查看文档 >>>

外表支持 MSCK REPAIR TABLE语法，可自动补齐分区，简化了外表DDL操作。

适用客户
MaxCompute公共云客户

发布功能
将数据导入oss后，oss文件路径符合如下格式 oss://xxx/table-location/ptname1=ptvalue1/ptname2=ptvalue2/xxx。创建外表并执行 msck repair table external_table_name [add partitions]，sql就会自动的解析oss的目录结构，自动识别分区，并为外表添加分区信息。

6.【新功能】外表访问OSS支持https

查询外部表时，支持底层通过https获取数据，加强了数据传输的安全性。

适用客户
MaxCompute公共云客户

发布功能
查询外部表时，若需要底层通过https获取数据，可以在sql前添加flag：set odps.sql.unstructured.data.oss.use.https=true;一起提交执行来实现。

7.【新功能】GROUPING SETS支持复杂CUBE & ROLLUP嵌套 查看文档 >>>

MaxCompute支持GROUPING SETS与CUBE & ROLLUP嵌套使用，简化了SQL书写，提高开发效率。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute扩充了GROUPING的表达方式，支持CUBE， ROLLUP，GROUPING SETS的嵌套使用，比如groupingsets((os,device,city),(os,device),(os),(),（os,city)),可写成：groupingsets(ROLLUP(os,device,city),(os,city))。

8.【新功能】新增Clone Table命令，支持表的复制 查看文档 >>>

MaxCompute 提供了Clone Table 功能，将表数据复制到另一个表中，让数据移动和复制更便捷。

适用客户
MaxCompute公共云客户

发布功能
MaxCompute 提供了Clone Table 功能，将表数据复制到另一个表中，让数据移动和复制更便捷。

9.【新功能】支持表级别的disable lifecycle 查看文档 >>>

新增SQL命令，支持表级别禁止/恢复生命周期。

适用客户
MaxCompute公共云客户

发布功能
适用TABLE DISABLE LIFECYCLE命令，可以取消掉已经给表设置的生命周期

产品官网 >>>
产品文档 >>>

欢迎扫码加入 MaxCompute开发者社区钉钉群，或点击链接申请加入。

相关实践学习

基于MaxCompute的热门话题分析

本实验围绕社交用户发布的文章做了详尽的分析，通过分析能得到用户群体年龄分布，性别分布，地理位置分布，以及热门话题的热度。

SaaS 模式云数据仓库必修课

本课程由阿里云开发者社区和阿里云大数据团队共同出品，是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法，从场景到实践，体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库，助力开发者学习了解先进的技术栈，并能在实际业务中敏捷的进行大数据分析，赋能企业业务。通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景，可应用MaxCompute实现数仓搭建，快速进行大数据分析。适合大数据工程师、大数据分析师大量数据需要处理、存储和管理，需要搭建数据仓库？学它！没有足够人员和经验来运维大数据平台，不想自建IDC买机器，需要免运维的大数据平台？会SQL就等于会大数据？学它！想知道大数据用得对不对，想用更少的钱得到持续演进的数仓能力？获得极致弹性的计算资源和更好的性能，以及持续保护数据安全的生产环境？学它！想要获得灵活的分析能力，快速洞察数据规律特征？想要兼得数据湖的灵活性与数据仓库的成长性？学它！出品人：阿里云大数据产品及研发团队专家产品 MaxCompute 官网 https://www.aliyun.com/product/odps 

阿里云 MaxCompute 2020-2 月刊

大数据计算 MaxCompute

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景