问题一:机器学习PAI我现在要hard负采,input4个表进去不太清楚PAI上怎么写?
机器学习PAI负采样表写config里的话,就没法制定分区了。
我看之前交付的demo是-Dtables里 把train,eval,负采样表都写进去了。
然后 -Dedit_config_json里面再配一遍负采样表。
但是这只是一个负采样表的情况。
我现在要hard负采,input4个表进去不太清楚PAI上怎么写?这个文档上没有PAI上负采样的配置demo
参考回答:
你看model_dir下面的pipeline.config 确认
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582137
问题二:机器学习PAI我删除一列试试,但是这个没有做读取的字段匹配吗?
机器学习PAI我的输入的训练maxcompute表比input_fields多一列导致的,我删除一列试试,但是这个没有做读取的字段匹配吗?
参考回答:
你可以在 EasyRec config 里面的 input 里面加上就好了。可以只加在 input 里面,后续的 feature config 没有用到也是可以的。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582119
问题三:机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗?
机器学习PAI我离线测了一下, 这里的separator 是针对单特征 多值的分割吗? 感觉没生效哇
这个是离线fg的代码吗?
参考回答:
这个目前是分为两步,一个是 fg, 一个是 EasyRec 。fg 的话你只需要看到 fg 的结果满足你的要求就可以。EasyRec 的话你这个应该是只需要关注 EasyRec config 的配置就可以。序列之间的分隔符用 separator (详细处理过程见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L667) ,多值的分隔符用 seq_multi_sep (见代码:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/input/input.py#L668C23-L668C36)
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/577008
问题四:机器学习PAI同一张表,也要加几个分区,写几遍表名吗?
机器学习PAI同一张表,也要加几个分区,写几遍表名吗?
"空间名.表名/分区1,空间名.表名/分区2,空间名.表名/分区3"
这样的吗?
参考回答:
好像是这样: -i pri_name.table/dt=20220101 -i pri_name.table/dt=20220102
Option option = new Option("i", "in_table", true, "input table");
final String [] inputTables = cmd.getOptionValues("in_table");
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/577015
问题五:机器学习PAI通过模型评估的模型,怎么进入不了模型流文件啊?
通过模型评估的模型,怎么进入不了模型流文件啊?
模型只能看到schema,底下是过滤通过的模型打印的评估结果
另外我设的200条一次
参考回答:
模型应该是半个小时生成一次。可以通过这个参数设置timeInterval ;另外 timeInterval是决定模型输出的, 要调整这个。 batchSize是更新使用的数据量,不是模型输出的时间
关于本问题的更多回答可点击原文查看: