阿里云 MaxCompute 2020-12 月刊

简介: 2020年12月 MaxCompute 在查询加速、流式数据写入、消费限制、实时作业监控、元数据服务方面有最新发布,欢迎通过本月刊了解12月最新发布详情。

【12月新发布功能】


1、MaxCompute 查询编辑器支持查询加速提升数据分析能力


MaxCompute 数据分析支持查询加速,当分析师通过SQL查询数据时,速度可提升至秒级,为数据分析师提供更优的数据分析体验。


适用客户及场景

数据分析师,尤其适用于数据分析师对离线数仓的数据进行取数,再通过Excel进行二次分析的场景。


发布功能

MaxCompute 数据分析查询模式支持 MaxCompute 查询加速,对于中、小数据量查询作业将执行时间从分钟级缩减至秒级。 通过 MaxCompute 查询编辑器发起查询 SQL 会优先通过查询加速进行查询,若满足则秒级返回结果,若不满足查询加速条件,则会回退离线查询,保障查询作业正常执行。


结合查询编辑器丰富的web-excel分析功能,数据分析师可通过MaxCompute数据分析快速的进行一站式数据查询、结果二次分析及结果分享。


MaxCompute查询加速功能当前支持按量计费资源,若您的项目使用包年包月资源,暂时还无法满足查询加速。


查看文档 >>


2、MaxCompute 流式数据写入服务(Streaming Tunnel)公测发布


MaxCompute Streaming Tunnel 服务,支持 API 方式实现流式数据无感知高 QPS 写入 MaxCompute。


适用客户

实时计算Flink、数据通道DataHub、数据传输服务DTS、消息服务kafka、实时数据同步等场景的企业、机构。


发布功能

流式语义API:全新的API,简化分布式服务开发操作。

自动创建分区:支持分布式服务并发创建分区。

支持数据异步 zorder by 排序功能。


查看文档 >>


3、MaxCompute 按量计费 SQL 支持日累计消费限制


MaxCompute 发布按量计费 SQL 日累计消费限制功能,该功能可以实时监控并阻止按量计费 project 的 SQL 消费超出预算。


适用客户及场景

  • 数据开发人员在数据开发过程中,通过开发项目进行数据探查、SQL测试等操作时,容易发起大输入量SQL且不能及时感知的,可通过该功能进行日累计总消费的限制。
  • 数据分析师通过SQL查询取数时,容易发起大输入量的查询SQL,此时可单独划分项目给分析师取数,并通过该功能进行日累计总消费限制。


发布功能

MaxCompute 发布按量计费 SQL 日累计消费限制功能,提供对整个 Project 标准 SQL 日累计消费进行限制。

Project 内当日标准 SQL 发生的计量累计消费与正在发起的标准 SQL 预估消费总和大于设定的值,则正发起 SQL 会被限制执行,返回失败状态并给出失败信息,通过该功能阻止标准 SQ L日累计消费超出预算。


在设置前,需要充分评估日常消费量,设置合理值,避免累计消费超过设定值后导致 SQL 作业无法执行而耽误业务产出。如发现设置不合理,Project owner 或拥有 SuperAdministrator 的管理员可以随时进行调整。


查看文档 >>


4、MaxCompute 运行中作业快照 Information_Schema.Tasks 内测发布


Information_Schema.Tasks 视图提供运行中作业的详细信息,支持通过该数据接口进行实时作业监控。


适用客户

需要实时监控作业并优化资源使用的客户


发布功能

以 Information_Schema.Tasks 视图方式,提供当前运行中作业的详细信息,包括作业列表以及各作业 cpu/内存使用大小和资源占比、运行时长等信息。通过该视图,使用人员可以快速定位运行时间较长的慢作业、资源消耗高的大作业,从而有针对性地进行作业优化或资源容量规划。


查看文档 >>


5、MaxCompute 新建 Project 默认提供 Information_Schema 服务(中国区)发布


新建的Project,无需管理员手动安装,默认自动提供 Information_Schema 元数据服务,便于用户查看使用。


优化功能

创建新的 MaxCompute Project,系统将自动提供该 Project 的元数据视图,不需要管理员通过安装 Package 方式获取,Information_Schema 成为 MaxCompute 默认提供的服务内容。


MaxCompute 产品官网 >>

阅读往期月刊 >>


更多关于大数据计算产品技术交流,可扫码加入 “MaxCompute开发者社区” 钉钉群

123.png



相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
目录
相关文章
|
2月前
|
人工智能 数据管理 Serverless
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
阿里云数据库走向Serverless与AI驱动的一站式数据平台具有重大意义和潜力
407 2
|
2月前
|
人工智能 运维 Cloud Native
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
、你如何看待阿里云数据库走向Serverless与AI驱动的一站式数据平台?
149 2
|
2月前
|
存储 数据可视化 数据管理
基于阿里云服务的数据平台架构实践
本文主要介绍基于阿里云大数据组件服务,对企业进行大数据平台建设的架构实践。
719 2
|
2月前
|
人工智能 数据管理 大数据
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
阿里云数据库走向Serverless与AI驱动的一站式数据平台是一个很有前景和意义的发展方向
35 2
|
24天前
|
机器学习/深度学习 分布式计算 数据挖掘
阿里云 MaxCompute MaxFrame 开启免费邀测,统一 Python 开发生态
阿里云 MaxCompute MaxFrame 正式开启邀测,统一 Python 开发生态,打破大数据及 AI 开发使用边界。
307 1
|
1月前
|
人工智能 DataWorks 数据可视化
心动基于阿里云DataWorks构建游戏行业通用大数据模型
心动游戏在阿里云上构建云原生大数据平台,基于DataWorks构建行业通用大数据模型,如玩家、产品、SDK、事件、发行等,满足各种不同的分析型应用的要求,如AI场景、风控场景、数据分析场景等。
335 1
|
1月前
|
Ubuntu JavaScript 关系型数据库
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
在阿里云Ubuntu 20.04服务器上部署Ghost博客的步骤包括创建新用户、安装Nginx、MySQL和Node.js 18.x。首先,通过`adduser`命令创建非root用户,然后安装Nginx和MySQL。接着,设置Node.js环境,下载Nodesource GPG密钥并安装Node.js 18.x。之后,使用`npm`安装Ghost-CLI,创建Ghost安装目录并进行安装。配置过程中需提供博客URL、数据库连接信息等。最后,测试访问前台首页和后台管理页面。确保DNS设置正确,并根据提示完成Ghost博客的配置。
在阿里云Ubuntu 20.04服务器中搭建一个 Ghost 博客
|
1月前
|
存储 分布式计算 网络协议
阿里云服务器内存型r7、r8a、r8y实例区别参考
在阿里云目前的活动中,属于内存型实例规格的云服务器有内存型r7、内存型r8a、内存型r8y这几个实例规格,相比于活动内的经济型e、通用算力型u1实例来说,这些实例规格等性能更强,与计算型和通用型相比,它的内存更大,因此这些内存型实例规格主要适用于数据库、中间件和数据分析与挖掘,Hadoop、Spark集群等场景,本文为大家介绍内存型r7、r8a、r8y实例区别及最新活动价格,以供参考。
阿里云服务器内存型r7、r8a、r8y实例区别参考
|
1月前
|
SQL 弹性计算 安全
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
当我们通过阿里云的活动购买完云服务器之后,并不是立马就能使用了,还需要我们设置云服务器密码,配置安全组等基本操作之后才能使用,有的用户还需要购买并挂载数据盘到云服务器上,很多新手用户由于是初次使用阿里云服务器,因此并不知道这些设置的操作流程,下面给大家介绍下这些设置的具体操作流程。
购买阿里云活动内云服务器之后设置密码、安全组、增加带宽、挂载云盘教程
|
1月前
|
弹性计算
阿里云3M带宽云服务器并发多大?阿里云3M带宽云服务器测评参考
在探讨云服务器3M带宽能支持多大并发这一问题时,我们首先要明白一个关键点:并发量并非仅由带宽决定,还与网站本身的大小密切相关。一般来说,一个优化良好的普通网站页面大小可能只有几K,为便于计算,我们可以暂且假定每个页面大小为50K。
822 1

相关产品

  • 云原生大数据计算服务 MaxCompute