开发者社区> 问答> 正文

用spark对原始数据做特征处理,最后通过决策树分类,请问怎么导出通过输入原始数据做分类的模型?

环境:scala 2.11.11,spark2.4,pmml

步骤描述:最近看了阿里PAI的产品,想仿照写一个小的例子。我定义了多个object class,每个class完成一种数据处理功能,然后输出一个新的文件提供给下一个class作为输入,从而完成一连串的数据转换及特征提取工作,最后输出文件用于决策树分类训练,从而得到训练模型。

问题:请问我该如何导出最终训练完的模型?如何只在决策树class中导出pmml模型,那么此pmml模型是不是不包含前面的一串数据处理方法?如果我部署此pmml模型,那么调用的时候是不是不能直接传入源数据?

如下图所示,每一个节点都是一个object class,需求是导出可通过输入原始数据做分类的模型

选区_010.png

本人机器学习小白,谢谢帮助

展开
收起
游客wtq6uww4oujtw 2019-11-22 10:18:05 682 0
0 条回答
写回答
取消 提交回答
问答排行榜
最热
最新

相关电子书

更多
Hybrid Cloud and Apache Spark 立即下载
Scalable Deep Learning on Spark 立即下载
Comparison of Spark SQL with Hive 立即下载