问题一:请教一下机器学习PAI,改成CHR(30)是否可以,改了后后续的代码需要怎么改动吗?
请教一下机器学习PAI,对于lookup 特征 如果k v 之间的连接文档中说需要用“:”,改成CHR(30)是否可以,改了后后续的代码需要怎么改动吗?我现在改成CHR(30)后 jar生成特征取不到对应的数值 ,然后这个特征上线应该怎么配置吗? 我们线上用“:”的时候,测试环境没跑通 不太清楚是什么环节出问题了,谢谢
参考答案:
这个 : 目前还不支持改,fg 里面都是用的这个 : 符号。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/570927
问题二:机器学习PAI指标差别比较大,有结论吗?
机器学习PAI ODPS的PAI使用训练好的DSSM模型使用同样的ckpt进行evaluate,单个worker多次evaluate的结果都不一致并且recall_at_k指标差别比较大,有结论吗?
参考答案:
根据已知信息,单个worker多次评估的结果不一致且recall_at_k指标差异较大可能是由于模型评估过程中存在一些随机性导致的。建议进一步分析模型评估的具体流程和参数设置,以找出导致结果差异的原因,并进行调整或改进。可以尝试指定不同的model_dir路径和checkpoint路径来观察结果是否稳定一致,同时检查训练和评估的参数配置是否一致,比如worker节点数量和资源配置,以及其他依赖表的配置。如果以上方法仍无法解决问题,可能需要进一步检查模型训练的稳定性和模型本身的问题。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/570926
问题三:机器学习PA如何指定使用最优的训练的ckpt?
机器学习PAI在ODPS上使用PAI命令调用easyrec进行evaluate的时候,如何指定使用最优的训练的ckpt?
参考答案:
在ODPS上使用PAI命令调用easyrec进行evaluate的时候,可以通过在命令中指定-Dcheckpoint_path参数来使用最优的训练的ckpt。例如,可以使用以下命令指定使用oss://easyrec/ckpt/MultiTower/model.ckpt-1000作为checkpoint_path:
pai -name easyrec -project algo_platform -Dcheckpoint_path=oss://easyrec/ckpt/MultiTower/model.ckpt-1000 -D...(其他参数) evaluate
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/570925
问题四:机器学习PAI DSSM的参数配置里可以去掉吗?
机器学习PAI DSSM的参数配置里可以去掉吗?例如图中就不给出两个塔的id项
文档里参数配置这一块对这个id配置有点语焉不详
参考答案:
现在的版本是没有实际用到,历史原因,不太能去掉了。但不用太care这个,也没有检查这两个id必须出现在特征里。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/570923
问题五:请教一下机器学习PAI DSSM这两个id在train/predict的时候发挥什么作用?
请教一下机器学习PAI DSSM这两个id在train/predict的时候发挥什么作用?我看了一下源码似乎没有找到这两个参数解析的踪迹。文档内这两个id对应的列名在DSSM模型的输入配置部分出现了,原理上不对哇?我们每一个user_id都是unique的,对于新用户承接而言模型没有见过它的user_id信息,我们只希望用他们的画像特征信息做u2i召回。如果模型强制要求user_id做输入,是不是意思是easyrec的DSSM模型完全不能用于新用户的item召回?
参考答案:
user_id不用做特征也可以的,没有强制要求user_id用作特征
关于本问题的更多回答可点击进行查看: