数据湖分析服务Data Lake Analytics发布支持OSS多版本优化、控制台等多项优化及改进-阿里云开发者社区

数据湖分析服务Data Lake Analytics发布支持OSS多版本优化、控制台等多项优化及改进

2020-02-24 2601

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 数据湖分析服务 Data Lake Analytics SQL引擎是兼容MySQL协议的，具备高性能的Serverless化的联邦分析引擎，支持OSS、MySQL、PG、SQLServer、Redis、MongoDB、HBase、OTS等数据源。

数据湖分析服务 Data Lake Analytics SQL引擎是兼容MySQL协议的，具备高性能的Serverless化的联邦分析引擎，支持OSS、MySQL、PG、SQLServer、Redis、MongoDB、HBase、OTS等数据源。本次发布提升及改进如下，列举部分：

支持OSS多版本优化：OSS的多版本的特性，导致OSS的shallow copy机制无法使用，因此ETL的时间都显著变长。优化后，在一些大客户使用，性能提升22%左右，主要节约rename中间的拷贝时间
TextFile格式支持alter table add column
限制深圳区域单表Partition不超过2w，避免平台被异常增加partition打挂
优化"OSS的Null IO stream的问题" 异常信息，此问题是 OSS中的数据是归档类型。后续在客户端直接提示分析数据源中含有归档类型，请注意转为普通数据类型
优化 MetaInfo.SqlExecutor.Parser 提示不明显，后续会提示详细错误信息
优化查询结果可以左右移动
增加URL定位到Schema

Data Lake Analytics（简称DLA）是阿里云上一款Serverless化的低成本大数据处理和分析服务。主打高性价比、打通和联合云上数据生态，以及高易用性的BI兼容能力。

高性价比：世界领先的并行SQL计算引擎能力，为用户提供千亿级数据的交互式分析能力和万亿级数据的批量处理能力，并按量付费，零资源维护和保有成本；
云上数据生态：提供阿里云上覆盖最广泛的数据联邦、融合分析、处理、回流能力，用统一的数据视角盘活、打通OSS、Table Store、日志服务数据湖投递、DBS数据库的数据湖备份、关系型数据库和NoSQL数据库的分析、处理生态；
易用的BI兼容能力：以MySQL用户接口的形态兼容几乎所有具备MySQL连接能力的BI套件和可视化分析工具，让用户轻松点击即可分析、洞见云数据价值。
产品链接：https://www.aliyun.com/product/datalakeanalytics
新客户1元试用：https://common-buy.aliyun.com/?commodityCode=openanalytics_post

数据湖开发者社区由阿里云开发者社区与阿里云Data Lake Analytics团队共同发起，致力于推广数据湖相关技术，包括hudi、delta、spark、presto、oss、元数据、存储加速、格式发现等，学习如何构建数据湖分析系统，打造适合业务的数据架构。

数据湖分析服务Data Lake Analytics发布支持OSS多版本优化、控制台等多项优化及改进