开发者社区> 问答> 正文

Spark 机器学习库从 1.2 版本以后被分为两个包是什么?

Spark 机器学习库从 1.2 版本以后被分为两个包是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-10 13:06:58 1843 0
1 条回答
写回答
取消 提交回答
  • spark.mllib包含基于RDD的原始算法API。Spark MLlib 历史比较长,在1.0 以前的版本即已经包含了,提供的算法实现都是基于原始的 RDD。

    spark.ml 则提供了基于DataFrames 高层次的API,可以用来构建机器学习工作流(PipeLine)。ML Pipeline 弥补了原始 MLlib 库的不足,向用户提供了一个基于 DataFrame 的机器学习工作流式 API 套件。

    2021-12-10 22:59:13
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
微博机器学习平台架构和实践 立即下载
机器学习及人机交互实战 立即下载
大数据与机器学习支撑的个性化大屏 立即下载