问题一:机器学习PAI上没有easyrec组件?
机器学习PAI上没有easyrec组件?
参考回答:
有啊,dataworks 或者pai designer的url https://easyrec.readthedocs.io/en/latest/quick_start/mc_tutorial_inner.html 阿里集团内看这个
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593243
问题二:机器学习PAI 那sub_feature_type 要改成IdFeature吗?
机器学习PAI SequenceFeature里面的sub_feature_type 如果是多值特征的tagfeature,
那sub_feature_type 要改成IdFeature吗?
参考回答:
在阿里云机器学习PAI平台中,对于SequenceFeature类型的特征,如果子特征是多值特征且每个子特征是一个类别标签(TagFeature),通常不需要将其sub_feature_type
改写为IdFeature
。SequenceFeature
主要用于处理有序的序列数据,其子特征可以是各种类型,包括TagFeature
(类别标签)。
TagFeature
表示的是类别特征,可以处理多值标签,每个标签代表一种类别,而在序列中,这些标签组成一个有序的序列。
IdFeature
通常用于标识型特征,尤其当特征是连续整数ID时,不过在处理序列特征时,通常关注的是类别标签而非ID值本身。
因此,如果子特征确实是类别标签,保持sub_feature_type
为TagFeature
通常是正确的选择。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593244
问题三:机器学习PAI用配置的办法能解决self-attention再target-attention吗?
机器学习PAI用配置的办法能解决self-attention再target-attention吗?
参考回答:
用组件化的方式可以配出来,不过这种复杂度比较高,跑起来可能比较忙,不是很建议,比较慢
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593245
问题四:请教个机器学习PAI问题,是怎么实现的呢?
请教个机器学习PAI问题,sequence_combiner的multi_head_attention 是怎么实现的呢?
参考回答:
代码都在 EasyRec 仓库里面的,比如这个 attention 实现在这里:https://github.com/alibaba/EasyRec/blob/master/easy_rec/python/layers/multihead_attention.py#L9
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593246
问题五:请教个机器学习PAI问题~不同目标的auc计算时,num_thresholds都是固定的同一个是吧?
请教个机器学习PAI问题~不同目标的auc计算时,num_thresholds都是固定的同一个是吧?如果是的话,这里会不会拆开比较好呢?
参考回答:
在阿里云机器学习PAI中,不同目标的AUC(Area Under the Curve)计算时,num_thresholds
参数并不一定是固定的同一个数值。num_thresholds
参数用于指定计算AUC时划分正负样本的阈值数量,不同的任务和模型可能会有不同的最优阈值数。
例如,在多标签分类或多任务学习场景下,各个任务的目标函数和评价指标可能不尽相同,因此针对每个目标计算AUC时,可以根据实际情况设置不同的num_thresholds
。
至于是否需要拆开,主要取决于以下因素:
- 任务复杂性:若各任务之间差异较大,或者每个任务的最佳阈值分布范围相差很大,可能需要独立设置
num_thresholds
以获得更精确的AUC估计。 - 计算资源:增加
num_thresholds
会增大计算量,如果计算资源有限,可能需要权衡每个任务的精度和整体计算时间。 - 评估准确性:更多的阈值划分可以使AUC曲线更加平滑,从而更精确地反映模型性能,但如果任务间差异不大,或者任务比较简单,过多的阈值划分可能并无太大意义。
总之,在实际应用中,应当根据具体任务需求和计算资源情况灵活设置num_thresholds
,不必拘泥于固定的一个数值。在PAI平台上,你可以为每个目标或任务单独配置相应的评估参数。
关于本问题的更多回答可点击原文查看:https://developer.aliyun.com/ask/593248