开发者社区问答正文

The Key to Machine Learning is Prepping the Right Data

Jean Georges Perri在Spark Summit 2017上做了主题为《The Key to Machine Learning is Prepping the Right Data》的演讲，就机器学习预备数据等进行了深入的分享。

https://yq.aliyun.com/download/611?spm=a2c4e.11154804.0.0.539d6a796Xu99r

展开

收起

福利达人 2018-06-17 18:35:36 947 版权

阿里云 AI 助理回答

Jean Georges Perri在Spark Summit 2017上的演讲《The Key to Machine Learning is Prepping the Right Data》强调了数据预处理在机器学习项目中的核心地位。这个主题指出，有效的数据准备是机器学习成功的关键步骤之一。在阿里云上，有许多产品和服务能够帮助用户进行高效的数据预处理，以支持机器学习项目的需求，以下是一些相关的产品：

MaxCompute（原名ODPS）：这是一个大数据处理平台，可以进行大规模数据的存储和计算。用户可以在MaxCompute上执行复杂的ETL（提取、转换、加载）任务，清洗和格式化数据，为机器学习模型训练做好准备。
DataWorks：它是一个一站式大数据开发和管理平台，集成了数据集成、数据开发、数据质量和数据服务等功能。通过DataWorks，用户可以构建数据管道，自动化数据预处理流程，确保数据质量，为机器学习模型提供高质量的输入。
PAI（Platform of Artificial Intelligence）：阿里云的机器学习平台，提供了丰富的数据处理组件和机器学习算法，支持用户进行数据清洗、特征工程等数据预处理工作，并可以直接在平台上构建、训练和部署机器学习模型。
EMR（Elastic MapReduce）：基于Apache Hadoop和Spark等开源技术的云上大数据处理服务，适合需要灵活使用Hadoop生态工具进行大数据分析和处理的场景，包括数据预处理阶段的复杂操作。
Quick BI：虽然主要定位为数据分析和可视化工具，但Quick BI也支持数据清洗和简单的数据转换功能，对于需要快速洞察数据并进行初步处理的用户来说非常有用。

通过这些工具和服务，阿里云为用户提供了一整套从数据存储、处理到机器学习模型构建的解决方案，帮助用户高效地完成数据预处理工作，加速机器学习项目的推进。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

机器学习/深度学习分布式计算 Spark

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

The Key to Machine Learning is Prepping the Right Data

相关文章