问题一:机器学习PAI离线过 fg 是什么意思?离线训练的时候吗?
机器学习PAI离线过 fg 是什么意思?离线训练的时候吗?
参考回答:
离线训练之前做的,因为有那些交叉统计特征是通过 lookup feature 计算出来的,所以需要先算出来,再训练
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/580113
问题二:机器学习PAI好几个raw_feature 怎么进行区分呢?
机器学习PAI好几个raw_feature 怎么进行区分呢?
参考回答:
在机器学习PAI中,对于有多个raw_feature的情况,可以通过以下步骤进行区分:首先,在EasyRec的配置文件中找到相应的特征定义部分。原始特征通常是在input或feature字段中定义的。然后,可以根据业务需求和数据特点为每个raw_feature设置不同的处理方式,如归一化、编码等。最后,通过模型训练和评估,观察不同raw_feature对模型性能的影响,进一步调整和优化模型。在整个过程中,需要密切注意数据的质量和特征选择,以确保模型的准确性和泛化能力。
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/580772
问题三:机器学习PAI看了下有weight的字段,但是好像只能设置成固定值?怎么读取输入样本的字段?
机器学习PAI看了下有weight的字段,但是好像只能设置成固定值?怎么读取输入样本的字段?
参考回答:
一个tower的task_space_indicator_label: 'treat', in_task_space_weight: 1.0, out_task_space_weight: 0.0,另一个tower的task_space_indicator_label: 'treat', in_task_space_weight: 0.0, out_task_space_weight: 1.0
https://easyrec.readthedocs.io/en/latest/reference.html
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582130
问题四:机器学习PAI基于sd 训练的脚本 改成训练大模型的网络比如小点的1.3B的 一般可以跑起来吗?
机器学习PAI基于sd 训练的脚本 改成训练大模型的网络比如小点的1.3B的 一般可以跑起来吗?你们有跑通的例子参考吗?
参考回答:
一段时间以前用dynamo + disc backend 跑过 llama7b finetune,但效果不是很好,主要受限于 dynamo 没有办法 trace collective ops
关于本问题的更多回答可点击原文查看:
https://developer.aliyun.com/ask/582107
问题五:机器学习PAI后续会更新dsw的huggingface镜像吗?
机器学习PAI后续会更新dsw的huggingface镜像吗?利用oss真的太麻烦了
参考回答:
按照位置区分
关于本问题的更多回答可点击原文查看: