开发者社区问答正文

Sparkling Water 2.0: The next generation of machine learning on Apache Spark

在SPARK SUMMIT 2017上，Jakub Háva，Core engineer in Sparkling Water team in H2O.ai分享了题为《Sparkling Water 2.0: The next generation of machine learning on Apache Spark》，就介绍H2O.ai，H4O+Spark =Sparkling Water，Sparkling Water介绍和使用等方面的内容做了深入的分析。

https://yq.aliyun.com/download/2105?spm=a2c4e.11154804.0.0.41216a79TWVDUc

展开

收起

福利达人 2018-07-29 00:40:00 1241 版权

阿里云 AI 助理回答

在SPARK SUMMIT 2017上，Jakub Háva的分享《Sparkling Water 2.0: The next generation of machine learning on Apache Spark》深入探讨了H2O.ai及其与Apache Spark的集成——Sparkling Water。虽然给出的知识库资料未直接包含该演讲内容，但可以提供以下相关信息帮助理解相关概念：

H2O.ai简介： H2O.ai是一家专注于人工智能和机器学习领域的公司，提供了一个开源的、分布式的内存计算平台，用于大规模的数据处理和高级分析应用。其核心产品H2O允许数据科学家和开发者在大数据集上快速构建、部署和运行机器学习模型。

H2O Spark = Sparkling Water： Sparkling Water是H2O.ai开发的一个项目，它使得H2O的机器学习算法可以直接在Apache Spark上运行。这意味着用户可以在Spark的大数据处理能力基础上，无缝利用H2O强大的机器学习功能，实现高效的数据处理与复杂模型训练的结合。通过Sparkling Water，数据科学家可以使用熟悉的Spark API（如DataFrame）来调用H2O的算法，并且能够将H2O的模型直接融入到Spark的管道（Pipelines）和工作流中。

Sparkling Water介绍和使用： - 深度集成：Sparkling Water实现了H2O与Spark的深度集成，让用户能够在Spark生态系统内直接使用H2O的算法，无需数据迁移。 - 算法丰富：提供了丰富的机器学习算法库，包括但不限于梯度提升树（GBM）、深度学习、随机森林等，支持分类、回归、聚类等多种任务。 - 易用性：用户可以通过Spark DataFrame API或者H2O Flow UI来构建和执行机器学习流程，降低了使用复杂模型的门槛。 - 交互性：支持Scala、Python、R等多种语言接口，便于不同背景的数据科学家和工程师使用。

要深入了解Sparkling Water 2.0的具体功能和使用方法，建议直接查阅当时的演讲资料或访问H2O.ai的官方文档和资源，以获取最详细和最新的信息。

有帮助

无帮助

AI 助理回答生成答案可能存在不准确，仅供参考

0 条回答

写回答

取消提交回答

问答分类：

分布式计算 Apache Spark

问答标签：

next Apache generation Apache next apache spark machine learning Apache machine learning apache spark

问答地址：

开发者社区 > 大数据 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Sparkling Water 2.0: The next generation of machine learning on Apache Spark

相关文章