备案控制台

开发者社区问答正文

spark中使用 ML Pipeline API的作用是什么？

spark中使用 ML Pipeline API的作用是什么？

展开

收起

游客k7rjnht6hbtk6 2021-12-10 13:08:29 544 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

游客daliwbfb2wo66

使用 ML Pipeline API可以很方便的把数据处理，特征转换，正则化，以及多个机器学习算法联合起来，构建一个单一完整的机器学习流水线。这种方式给我们提供了更灵活的方法，更符合机器学习过程的特点，也更容易从其他语言迁移。Spark官方推荐使用spark.ml。如果新的算法能够适用于机器学习管道的概念，就应该将其放到spark.ml包中，如：特征提取器和转换器。开发者需要注意的是，从Spark2.0开始，基于RDD的API进入维护模式（即不增加任何新的特性），并预期于3.0版本的时候被移除出MLLib。

2021-12-10 13:12:53

赞同展开评论

问答分类：

分布式计算 API Spark

问答标签：

pipeline API apache spark API API spark apache spark ml apache spark Pipeline

问答地址：

开发者社区 > 大数据 > 问答

相关问答

对于Flink CDC，有用 flink rest api 提交cdc pipeline 的嘛？

107

0

0

问下 Flink-cdc pipeline声明的yaml如何使用rest-api提交呢？

92

1

0

Flink CDC中pipeline 能不能使用api方式在自己程序中调起，跟之前的cdc一样？

129

0

0

"adb spark的lakehouse api访问内表数据，还支持算子下推吗？

130

2

0

flink有api可以像 spark那样批出 kafka数据吗？

995

6

0

Spark 的 ML 和 MLLib 两个包区别和联系是什么？

722

1

0

Spark 的 ML 和 MLLib 两个包的区别是什么？

373

1

0

Alink相对于Spark ML有哪些特色？

1352

1

0

这个API那个公共参数不就8个吗？后面然后跟上调用接口的参数对面？

1083

0

0

FC的域名管理有API接口吗？

1084

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

我们来说一下 synchronized 与 ReentrantLock 的区别

AI Ping性能罗盘：免费开源双雄！GLM-4.7与MiniMax M2.1实测横评

CNFANS模式淘宝1688代购系统搭建指南

别再把 K8s 当大号 Docker 了：我用 Kubernetes 跑数据任务踩过的那些坑

一个 .NET 开源免费、功能强大的 UI 自动化库

还有其他疑问?