问题一:机器学习PAI中aux_hist_seq在target attention计算中会起到怎样的作用?
"机器学习PAI中aux_hist_seq在target attention计算中会起到怎样的作用,以及对于最终输出的embedding维度会有怎样的改变吗?
参考答案:
不会改变最终输出的embedding维度
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/588637
问题二:机器学习PAI新包的package名是什么?
"机器学习PAI新包的package名是什么?
参考答案:
"set odps.stage.mapper.split.size=32;
set odps.isolation.session.enable=true;
--@resource_reference{""feature_generator-1.0.jar""}
jar -resources feature_generator-1.0.jar,test_fg2.json
-classpath feature_generator-1.0.jar
com.aliyun.pai.Main -i test_fg_input2 -o test_fg_encoded/ds=20231125 -f test_fg2.json;
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/588635
问题三:机器学习PAI这个读数据表-2 应该是什么数据?
"机器学习PAI这个 读数据表-1 是每一行都是 用户ID和点击的 itemId, 那这个读数据表-2 应该是什么数据?
参考答案:
建议用这个:https://help.aliyun.com/zh/pai/use-cases/improved-swing-similarity-calculation-algorithm
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/588634
问题四:机器学习PAI中看easyrec的训练,也没指定entryfile,这是怎么做的啊?
机器学习PAI中看easyrec的训练,也没指定entryfile,这是怎么做的啊?
参考答案:
在PAI中,EasyRec的训练不需要指定entryfile,因为EasyRec通过Blink来构造实时样本和特征,并调用Feature Generation对特征进行加工,然后通过Kafka、DataHub读取实时的样本流进行训练。 实时训练的稳定性比较重要,我们在训练过程中对正负样本比、特征的分布、模型的auc等做实时的监控,当样本和特征的分布变化超过阈值时,报警并停止更新模型。 保存checkpoint时,EasyRec会同步记录当前训练的offsets(多个worker一起训练时,会有多个offset),当系统发生故障重启时,会从保存的offsets恢复训练。 效果验证 EasyRec在多个用户场景中得到了验证,场景中包括商品推荐、信息流广告、社交媒体、直播、视频推荐等。
关于本问题的更多回答可点击进行查看:
https://developer.aliyun.com/ask/588632
问题五:机器学习PAI中如果用udf,只上传一个protoc安装包,和proto 产出的pb文件就可以吗?
机器学习PAI中如果用udf,只上传一个protoc安装包,和proto 产出的pb文件就可以吗?
参考答案:
mc上没有的肯定要自己传
关于本问题的更多回答可点击进行查看: