备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI中batch模型的参数需要与fine-tune 保持一致吗？

机器学习PAI中batch模型的lr、decay_steps、decay_factor等参数需要与fine-tune 保持一致吗？

展开

收起

三分钟热度的鱼 2023-06-28 11:29:54 107 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

哈哈是我

在机器学习中，通常将学习率（learning rate）、衰减步数（decay steps）和衰减因子（decay factor）等参数用于优化算法中的学习率衰减策略。当使用 fine-tune 过程时，这些参数的设置通常需要进行一些调整。

Fine-tuning 是指在预训练模型的基础上，继续进行训练以适应特定任务或数据集。这意味着在 fine-tune 过程中，模型的原始参数已经较好地收敛并保留了一定的知识。因此，在 fine-tune 过程中，通常不需要使用与初始训练相同的学习率衰减策略。

在 fine-tune 过程中，可以尝试以下几种策略：

固定学习率：可以尝试使用一个固定的较小学习率，以保持在 fine-tune 过程中不会破坏初始训练的参数。

学习率微调：可以选择在 fine-tune 过程中微调学习率。例如，可以尝试减小学习率衰减步数或衰减因子，使模型在 fine-tune 过程中更慢地收敛。

衰减策略选择：根据 fine-tune 过程中的训练情况，可以选择不同的衰减策略。可以根据验证集的性能来选择最佳的衰减步数和衰减因子。

总之，fine-tune 过程中的学习率衰减策略通常需要进行一些调整，以便更好地适应新的任务和数据集。可以根据实验结果和验证集的性能来选择最佳的参数设置。

希望以上信息对您有所帮助！如有任何进一步的问题，请随时提问。

2023-10-17 11:57:32

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

人工智能平台 PAI模型机器学习人工智能平台 PAI 人工智能平台 PAI参数人工智能平台 PAI pai 人工智能平台 PAI机器学习

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

请教下，机器学习PAI哪些模型用户的emb数会不同啊？

156

1

0

机器学习PAI中DSSM向量召回模型拆分导出类型有三种（best、final和latest）？

252

6

0

我的机器学习PAI序列特征就像示例一样做一个attention再进入模型，这样可以吗?

86

3

0

机器学习PAI-Dinput_table，线上分区表，如何使用${bizdate}参数？

295

3

0

机器学习PAI CoMetricLearningI2I按文档已经完成!模型输出怎么搞?

85

1

0

机器学习PAI有没有配置cluster 系统自动生成分布式参数的文档？

84

1

0

机器学习PAI Alink的在线学习组件支持LSTNet模型吗？

94

2

0

cam++说话人识别模型部署到PAI在线服务后modelscope请求体的参数应该怎么填？

113

1

0

请问机器学习PAI的easyrec的predict任务为什么不支持lifecycle参数呀？

96

2

0

机器学习PAI模型使用mmoe+din+senet时，遇到如下错误，帮忙看看时怎么回事？

121

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

运维也能很“智能”？聊聊如何用智能化运维搞定用户体验

256KB内存约束下的设备端训练：算法与系统协同设计——论文解读

TensorFlow Lite Micro：嵌入式TinyML系统上的机器学习推理框架——论文深度解析

CMSIS-NN：ARM Cortex-M处理器的高效神经网络内核——论文解读

μNAS：面向微控制器的约束神经架构搜索——论文解读

热门讨论

热门文章

在api调用夸克搜索时，遇到权限不足问题

iTAG阿里的数据标注任务怎么对接呀？

ide中每次启动需要再次登录，非常麻烦

机器学习PAI我训练的AUC 0.7左右，这个效果是不是很差了？

通义千问 HTTP请求多轮对话的方式是什么格式的，文档里的没法实现，需要帮助，谢谢

使用通义灵码时，对话框字体怎么设置？

使用websocket请求asr 返回40000002错误码

机器学习PAI的Alink有界面吗？

Intellij idea如何配置通义灵码

阿里云的镜像上搜不到机器学习PAI的input用的common_io为什么？

展开全部

【玩转数据系列三】利用图算法实现金融行业风控

机器学习PAI全新功效——实时新闻热点Online Learning实践

【玩转数据系列五】农业贷款发放预测

【玩转数据系列十一】机器学习PAI眼中的《人民的名义》

推荐系统之冷启动问题

如何使用阿里云机器学习PAI的离线周期性调度功能

PAI智能答疑机器人上线啦

ALS算法实现用户音乐打分预测

利用PAI-DSW访问Github, 快速获取最新的学习资源

test_multiEvaluation

展开全部

还有其他疑问?