开发者社区> 问答> 正文

Spark MLlib中的DataFrame的作用是什么?

Spark MLlib中的DataFrame的作用是什么?

展开
收起
游客k7rjnht6hbtk6 2021-12-09 20:22:16 364 0
1 条回答
写回答
取消 提交回答
  • 使用Spark SQL中的DataFrame作为数据集,它可以容纳各种数据类型。 较之 RDD,包含了 schema 信息,更类似传统数据库中的二维表格。它被 ML Pipeline 用来存储源数据。例如,DataFrame中的列可以是存储的文本,特征向量,真实标签和预测的标签等。

    2021-12-09 20:22:36
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载