阿里云 MaxCompute MaxFrame 正式开启公测!
在当今数据驱动时代,大数据处理和人工智能(AI)技术的高效应用成为了企业和研究机构不可或缺的一部分。Python 凭借其丰富的第三方开发生态(例如 NumPy、Pandas 和 Scikit-learn)在数据科学领域内提供了强大的支持,但这些工具往往受限于单机或单核计算能力,难以满足分布式大数据处理的需求。
为满足用户在 Python 生态中日益增长的高效大数据处理和AI开发需求,MaxCompute 提供了分布式计算框架 MaxFrame,支持 Python 编程接口并可直接复用 MaxCompute 弹性计算资源及海量数据,100%兼容 Pandas 且自动分布式,与 MaxCompute Notebook、镜像管理等功能共同构成了 MaxCompute 的 Python 开发生态。用户可以以更熟悉、高效、灵活的方式在 MaxCompute 上进行大规模数据分析处理、可视化数据探索分析以及科学计算、ML/AI 开发等工作。
产品优势
更熟悉的开发习惯
MaxFrame 提供 Python 编程接口,100%兼容 Pandas 算子,且算子提交至 MaxCompute 自动分布式执行,不再受本地资源大小限制。
更高效的数据处理能力
MaxFrame 直接在 MaxCompute 集群中进行数据分布式计算,运行时无需将数据拉取至本地处理,消除了不必要的本地数据传输,提高作业执行效率。
更便捷的开发体验
MaxFrame 已与 MaxCompute Notebook、DataWorks 集成,提供开箱即用的交互式开发环境及离线调度能力;MaxFrame 支持在代码开发中直接引用 MaxCompute 内置镜像(Pandas、Numpy、XGBoost 等)、用户自定义镜像及自动化打包,且支持 Python3.7 和 Python3.11 多个版本,无需考虑复杂的环境准备及兼容问题。
应用场景
MaxFrame 适用于大规模数据处理、科学计算、机器学习、AI 开发等场景:
- Python 生态开发:对于需要开箱即用的 Python 环境,并迅速进行数据处理、数据科学和交互式数据探索的开发人员而言,MaxFrame 提供了一个理想的解决方案。
- 大规模数据分析与处理:当数据量庞大、处理逻辑复杂时,MaxFrame 借助 MaxCompute 海量数据和计算资源的分布式能力,显著提高数据分析、处理及数据挖掘的开发效率。
- Data+AI 开发:对于整个分布式数据开发和模型开发过程依赖于第三方或自定义镜像的场景,MaxFrame 提供完整的支持,以满足从数据处理到 AI 模型训练与部署的需要。
适用人群
- 数据分析师:处理数据量大、处理逻辑复杂,需要基于 MaxCompute 弹性计算资源、海量数据及 MaxFrame 分布式能力进行大规模数据分析、处理及数据挖掘,提高开发效率。
- 数据科学家:熟悉 Python 开发生态,需要开箱即用的 Python 开发环境快速进行数据科学、大规模数据处理及交互式数据探索等开发。
- AI 开发工程师:面向 Data + AI 开发,需要打通数据分析、数据处理、模型开发、模型训练等流程,实现端到端、一体化开发。
试用流程
在 MaxFrame 公测期间,每个租户可领取 5000CU 免费资源,可抵扣 MaxFrame 计算资源费用。
开通 MaxFrame 之后您可在本地环境(Python3.7或3.11 版本)、DataWorks、MaxCompute Notebook 中进行使用。
您也可以直接 DSW Gallery 提供的示例快速体验 MaxFrame。
https://gallery.pai-ml.com/#/preview/dataScience/maxframe/pandas/product_sales_demo
- 加入钉群
如果您在使用 MaxCompute MaxFrame 的过程中遇到任何疑问,可加入钉钉群37130012987咨询。
快速跳转