阿里云 MaxCompute 2020-8 月刊

简介: MaxCompute商业化发布数据备份恢复和数据科学Mars两项重要功能,同时公测发布MaxCompute查询加速。秒级恢复误删除数据,分布式加速 Python 数据科学栈,自动识别短查询作业并加速处理,满足报表分析、即席查询场景的使用要求尽在8月刊。

【8月新功能发布】

1. MaxCompute 数据备份与恢复功能 中国大陆区域(商业化)发布

MaxCompute备份与恢复功能提供持续备份用户修改/删除历史数据,支持快速恢复,持续保护数据安全。

适用客户
· 对数据保护有强需求客户
· 担心数据误删除的客户
· 担心数据被恶意删除的客户
· 适合广泛的企业级客户。

发布功能
MaxCompute提供数据备份与恢复功能,系统会自动备份数据的历史版本(例如被删除或修改前的数据)并保留一定时间,您可以对保留周期内的数据进行快速恢复,避免因误操作丢失数据。

☆ 备份与恢复功能具备以下特点:
· 默认开启,不需要手动开通 - 该功能不依赖外部存储,系统默认为所有MaxCompute项目开放的数据保留周期为1天,备份和存储免费。
· 自动持续备份 - 系统自动对发生变更的数据进行备份,多次变更时将备份多个数据版本,相比固定周期性的备份策略,可以有效避免因误操作丢失数据。
· 恢复快速,操作简单 - MaxCompute具备先进的元数据和多数据版本管理能力,备份和恢复操作不占用额外的计算资源,您可以通过命令快速恢复不同规模的数据。

查看文档 >>

2. MaxCompute 数据科学Mars 中国大陆区域(商业化)发布

Mars 是基于张量的数据科学加速引擎,能分布式加速 numpy、pandas、scikit-learn 和 Python 函数。

适用客户
· Python 数据分析师
· 数据工程师
· 开发者

发布功能
Mars 能利用并行和分布式技术,加速 Python 数据科学栈,兼容 numpy、pandas 和 scikit-learn接口。新的 Remote API 能轻松并行执行 Python 函数,Mars能轻松与TensorFlow、PyTorch 和 XGBoost 集成。
在 MaxCompute 上使用 Mars,支持简单易用的接口来拉起 Mars 集群,不需关心安装和维护集群,具备开箱即用的环境,如 DataWorks 的 pyodps3 节点,已经包含了 Mars。集群内的 Mars 任务可以直读和直写 MaxCompute 表。Mars 集群一旦创建,后续不再需要通过 MaxCompute 调度,任务可以直接提交到 Mars 集群执行。Mars 对于中小型任务(数据量 T 级别以下),具备优秀的性能表现。

查看文档 >>


3. MaxCompute 查询加速(公测)发布

MaxCompute的MCQA(MaxCompute Query Acceleration)功能可以对中、小型查询作业进行加速优化,将执行时间为分钟级的查询作业缩减至秒级,且兼容原查询功能。

适用客户
· BI工程师/数据分析师,对一份数据进行反复交互式探索;
· 业务系统/数据分析师,进行快速超大规模历史明细数据的访问;
· 数据开发工程师,查询验证和函数调试。

发布功能
MaxCompute的查询加速(MCQA)功能可以使EB级数据仓库服务内提供弹性并发的秒级查询能力,在MaxCompute原先吞吐量优化的基础上,补足对延迟优先场景的支持能力。
查询加速让MaxCompute一个服务同时满足数据准备(ETL)、数据挖掘(机器学习)、数据探索(Ad-hoc)、报表分析等多使用场景需要。通过自动识别短查询作业并加速处理、快速响应查询结果的方式,增强了 MaxCompute SQL的整体处理性能,满足报表分析、即席查询场景的使用要求。

查看文档 >>

【8月精选直播回顾】

2020阿里巴巴大数据技术公开课第四季

| MaxCompute 持续定义SaaS模式云数据仓库— 云数据仓库+BI
| MaxCompute 持续定义SaaS模式云数据仓库 — 云数据仓库+实时分析
| MaxCompute 持续定义SaaS模式云数据仓库 — 云数据仓库+实时搜索
| MaxCompute 持续定义SaaS模式云数据仓库 — 云数据仓库+Severless
| MaxCompute 持续定义SaaS模式云数据仓库 — 云数据仓库+AI
| MaxCompute 持续定义SaaS模式云数据仓库 — 云数据仓库+数据银行


MaxCompute 产品官网 https://www.aliyun.com/product/odps
阅读往期月刊 https://yq.aliyun.com/publication/49
更多关于大数据计算产品技术交流,可扫码加入 “MaxCompute开发者社区” 钉钉群
image.png

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
目录
相关文章
|
5月前
|
存储 分布式计算 大数据
【赵渝强老师】阿里云大数据存储计算服务:MaxCompute
阿里云MaxCompute是快速、全托管的TB/PB级数据仓库解决方案,提供海量数据存储与计算服务。支持多种计算模型,适用于大规模离线数据分析,具备高安全性、低成本、易用性强等特点,助力企业高效处理大数据。
277 0
|
5月前
|
数据采集 人工智能 大数据
10倍处理效率提升!阿里云大数据AI平台发布智能驾驶数据预处理解决方案
阿里云大数据AI平台推出智能驾驶数据预处理解决方案,助力车企构建高效稳定的数据处理流程。相比自建方案,数据包处理效率提升10倍以上,推理任务提速超1倍,产能翻番,显著提高自动驾驶模型产出效率。该方案已服务80%以上中国车企,支持多模态数据处理与百万级任务调度,全面赋能智驾技术落地。
597 0
|
3月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
336 2
|
3月前
|
存储 分布式计算 资源调度
【赵渝强老师】阿里云大数据MaxCompute的体系架构
阿里云MaxCompute是快速、全托管的EB级数据仓库解决方案,适用于离线计算场景。它由计算与存储层、逻辑层、接入层和客户端四部分组成,支持多种计算任务的统一调度与管理。
321 1
|
存储 机器学习/深度学习 人工智能
阿里云ODPS:在AI浪潮之巅,铸就下一代智能数据根基
在智能爆炸时代,ODPS正从传统数据平台进化为“AI操作系统”。面对千亿参数模型与实时决策挑战,ODPS通过流批一体架构、多模态处理、智能资源调度等技术创新,大幅提升效率与智能化水平。从自动驾驶到医疗联合建模,从数字孪生到低代码AI开发,ODPS正重塑企业数据生产力,助力全球客户在算力洪流中抢占先机。
204 0
|
3月前
|
机器学习/深度学习 传感器 分布式计算
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
数据才是真救命的:聊聊如何用大数据提升灾难预警的精准度
288 14
|
5月前
|
数据采集 分布式计算 DataWorks
ODPS在某公共数据项目上的实践
本项目基于公共数据定义及ODPS与DataWorks技术,构建一体化智能化数据平台,涵盖数据目录、归集、治理、共享与开放六大目标。通过十大子系统实现全流程管理,强化数据安全与流通,提升业务效率与决策能力,助力数字化改革。
191 4
|
4月前
|
机器学习/深度学习 运维 监控
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
运维不怕事多,就怕没数据——用大数据喂饱你的运维策略
177 0