问题一:机器学习PAI需要大力做一下用户和item侧的统计特征,我数据源中没有类似的tag会影响很大吗?
https://developer.aliyun.com/article/923697 需要大力做一下用户和item侧的统计特征;用户偏好的KV 特征,类似上文里面的tagList特征,我们文档里面的KV + query Key的lookup 特征,我数据源中没有类似的tag会影响很大吗?
参考回答:
用MovieLens 25M Dataset 大一点的数据集呢?
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503271?spm=5176.8068049.0.0.77566d1989YhJO
问题二:机器学习PAI中我这里是将用户对这个物品的情感评分作为label 好差评相差大,为什么呢?
机器学习PAI中我这里是将用户对这个物品的情感评分作为label
好评的话就分数接近1 差评分数接近0,小于0.5的只有8千多条 大于0.5的有近4万条,为什么这样?
参考回答:
看起来数据集中正负样本的数量不太均衡,可能会对模型的训练产生影响。建议正负样本数量尽量平衡,比如过采样、欠采样这些操作试一下效果。也可以试下F1_REWEIGHTED_LOSS,可以调整二分类召回率和准确率相对权重的损失函数,可有效对抗正负样本不平衡问题
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503269?spm=5176.8068049.0.0.77566d1989YhJO
问题三:机器学习PAI训练出来的结果auc一条直线是label打的有问题吗?
机器学习PAI训练出来的结果auc一条直线是label打的有问题吗?
参考回答:
建议先从数据集查一下原因,看一下训练数据集中类别分布,没问题的话,再看一下模型、超参数和特征选择这些
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503268?spm=5176.8068049.0.0.77566d1989YhJO
问题四:机器学习PAI中_is_training 是在哪里设置的啊?
机器学习PAI中is_training=self._is_training 想问下_is_training 是在哪里设置的啊?
参考回答:
这是内部变量
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503267?spm=5176.8068049.0.0.77566d1989YhJO
问题五:机器学习PAI中feature selection生成的特征重要性中mean_drop_p的含义是?
机器学习PAI中请教个问题:feature selection生成的特征重要性中mean_drop_p的含义是?这个值越大特征越重要吗?
参考回答:
mean_drop_p的含义是特征被丢弃的概率,越大代表丢弃概率越大
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503265?spm=5176.8068049.0.0.77566d1989YhJO
问题六:请问机器学习PAI训练BST模型时为什么会维度不匹配呢?
请问机器学习PAI训练BST模型时为什么会维度不匹配呢?
同样的数据DCN可以训练
参考回答:
你可以配置两组,每组一个seq 试试
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/503264?spm=5176.8068049.0.0.77566d1989YhJO