开发者社区> 晋恒> 正文
阿里云
为了无法计算的价值
打开APP
阿里云APP内打开

阿里云 MaxCompute 2020-10 月刊

简介: MaxCompute10月新发布功能在sql的产品能力、易用性、性能以及存储优化方面持续增强,欢迎阅读本刊了解最新feature及用法。
+关注继续查看

【10月新功能发布】

1、MaxCompute 支持 sort by 不带 distribute by

MaxCompute 支持 sort by 不带 distribute by,提供数据重排的解决方案,提高SQL执行的过滤性能。

适用客户
开发者

发布功能
MaxCompute 支持不带 distribute by 的sort by,提供数据重排的解决方案,提高谓词下推的过滤性能。当 sort by 语句前没有 distribute by 时能够增加

存储压缩率,同时读取的时候如果有过滤,能够利用这个信息减少真正从磁盘读取的数据量,提高后面进行的全局排序的效率。

查看文档 >>


2、SEMI JOIN 支持 MAPJOIN Hint

SEMI JOIN支持MAPJOIN Hint,提高 LEFT SEMI/ANTI JOIN的性能,为数据倾斜问题提供解决方案。

适用客户
开发者,分析师

发布功能
当一个大表和一个或多个小表JOIN时,用户可以在SELECT语句中显式指定MAPJOIN Hint以提升查询性能。目前MAPJOIN Hint进一步支持 LEFT SEMI JOIN和LEFT ANTI JOIN, 可以提高SEMI JOIN的性能,同时也为数据倾斜问题提供解决方案。

查看文档 >>


3、OSS外部表CSV/TSV文件支持GBK编码格式

OSS外部表CSV/TSV文件支持GBK编码格式。

适用客户
开发者

发布功能
OSS 外部表 odps.text.option.encoding 原先支持三种格式:UTF-8/UTF-16/US-ASCII,在新版本中增加了对GBK编码格式的支持。

查看文档 >>


4、批量 Drop Partition 支持条件筛选

使用条件表达式匹配选中的分区进行批量删除,满足用户希望一次删除符合某个规则的一个或多个分区的需求。

适用客户
开发者、数据仓库管理员

发布功能
支持条件筛选方式删除分区。如果用户希望一次性删除符合某个规则条件的一个或多个分区,可以使条件表达式匹配选中的分区进行批量删除。

查看文档 >>


5、MaxCompute 新增支持更多内置函数

新增 WIDTH_BUCKET 函数,时间函数 year/quarter/month 等对 DateTime 输入数据类型的支持。

适用客户
开发者、数据分析师

发布功能
WIDTH_BUCKET函数:获取某个字段值落入的分组编号,设定分组范围的最小值和最大值,以及分组个数,构建指定个数的大小相同的分组,返回字段值落

入的分组编号。
时间函数 year/quarter/month/day/hour/minute/second 增加对DateTime输入数据类型的支持 - 增加如下内建函数接口:
• INT year(datetime date)
• INT quarter(datetime date)
• INT month(datetime date)
• INT day(datetime date)
• INT hour(datetime date)
• INT minute(datetime date)
• INT second(datetime date)

查看文档 >> 查看文档 >>


6、MaxCompute 写表支持Zorder by语句

增加 SQL DML的 zorder by 语句,支持把数据相近的行排列在一起,提升查询时的过滤性能,一定程度上降低存储成本。

适用客户
开发者、数据分析师

发布功能
增加 SQL DML 的 zorder by 语句,支持DML语句的方式把数据相近的行排列在一起,提升查询时的过滤性能,一定程度上降低存储成本。

查看文档 >>


阅读往期月刊 >>
MaxCompute 产品官网 >>
免费下载《SaaS模式云数据仓库手册》>>

更多关于大数据计算产品技术交流,可扫码加入 “MaxCompute开发者社区” 钉钉群
123.jpg

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
MaxCompute Tunnel 日常工作使用讲解|阿里云产品内容精选(四十六)
MaxCompute是面向分析的企业级SaaS模式云数据仓库,它以Serverless架构提供快速、全托管的在线数据仓库服务,消除传统数据平台在资源扩展性和弹性方面的限制,最小化用户运维投入,使您经济并高效的分析处理海量数据。
241 0
MaxCompute日常工作及实践扩展|阿里云产品内容精选(三十二)
本文内容取自开发者社区阿里巴巴大数据计算技术圈,为大家提供相关技术思考。
98 0
企业级 SaaS 模式云数据仓库MaxCompute实战案例|阿里云产品内容精选(二十八)
本文给大家推荐一下关于MaxCompute的实战案例及相关探索。
168 0
SaaS模式云数据仓库Maxcompute使用指南|阿里云产品内容精选(十八)
本文主要推荐阿里云大数据计算服务MaxCompute使用指南。
163 0
[大数据新手上路]“零基础”系列课程--如何将ECS上的Hadoop数据迁移到阿里云数加·MaxCompute
 想用阿里云数加·大数据计算服务(MaxCompute),但是现在数据还在hadoop上,怎么办?   别烦恼,跟着我们走,来一次MaxCompute零基础数据迁移之旅~Let’s Go!
15220 0
《阿里云周刊》第5期 MaxCompute 2.0重磅发布!
阿里云周刊 Alibaba Cloud Weekly News 第4期 汇聚阿里云一周最新动态,为您了解阿里云相关产品、发展并参与相关活动提供参考。
4915 0
一分钟了解阿里云产品:大数据计算服务MaxCompute概述
  阿里云发布了许多产品,今天让我们来了解下大数据计算服务MaxCompute这款产品吧。     什么是MaxCompute呢?   MaxCompute是由阿里云自主研发,是阿里巴巴自主研发的海量数据处理平台。提供针对TB/PB级数据、实时性要
17489 0
一分钟了解阿里云产品:使用阿里云MaxCompute之点滴
这次做网聚宝搜索服务化这个项目,体验了一下阿里云的重量级云产品MaxCompute。MaxCompute在网聚宝搜索上云这个项目中起到了非常至关重要的作用,一句话总结:MaxCompute是非常靠谱的。在此将之前碰到问题点做一下总结,希望对有和我们一样需求的团队或者个人有所帮助。     那么
3702 0
+关注
晋恒
大数据计算服务MaxCompute产品运营
文章
问答
文章排行榜
最热
最新
相关电子书
更多
阿里云MaxCompute百问百答
立即下载
《阿里云MaxCompute & 帆软企业级BI分析》
立即下载
2019大数据技术公开课第五季—Hive迁移到MaxCompute最佳实践
立即下载