备案控制台

开发者社区云计算文章正文

save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

2023-12-19 70

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

save_summary_steps这个参数是用来控制训练过程中保存摘要的频率的。默认情况下，每1000个步骤会保存一次摘要。如果你将其设置为50，那么理论上应该每50个步骤就会保存一次摘要。

然而，这并不意味着每次保存摘要时都会进行一次评估。评估是在每个评估周期（eval_steps）进行的，而不是在每个保存摘要的步骤。所以，如果你的eval_steps设置为1000，那么每1000个步骤才会进行一次评估。

至于你提到的eval_results在global_step达到1000后就不再为空，这可能是因为在训练开始时，模型还没有开始进行评估，所以eval_results为空。当global_step达到1000时，模型已经进行了第一次评估，所以eval_results就不再为空了。

如果你希望更频繁地进行评估，可以考虑减小eval_steps的值。但是请注意，频繁的评估可能会增加训练的时间，因为每次评估都需要对整个数据进行前向传播。

sunrr

目录

相关文章

sunrr

|

7月前

|

自然语言处理

在ModelScope中，你可以通过设置模型的参数来控制输出的阈值

在ModelScope中，你可以通过设置模型的参数来控制输出的阈值

sunrr

195 1 1

芯在这

|

7月前

|

机器学习/深度学习存储 JSON

ModelScope问题之加载训到一半保存的checkpoint接着训练如何解决

ModelScope训练是指在ModelScope平台上对机器学习模型进行训练的活动；本合集将介绍ModelScope训练流程、模型优化技巧和训练过程中的常见问题解决方法。

芯在这

150 0 0

小言从不摸鱼

|

2月前

|

存储并行计算 PyTorch

探索PyTorch：模型的定义和保存方法

探索PyTorch：模型的定义和保存方法

小言从不摸鱼

59 1 1

Deephub

|

3月前

|

自然语言处理数据可视化 API

优化采样参数提升大语言模型响应质量：深入分析温度、top_p、top_k和min_p的随机解码策略

本文详细解析了大语言模型（LLM）的采样策略及其关键参数，如温度和top_p。LLM基于输入提示生成下一个标记的概率分布，通过采样策略选择标记并附回输入，形成循环。文章介绍了对数概率（logprobs）、贪婪解码、温度参数调整、top-k与top-p采样等概念，并探讨了min-p采样这一新方法。通过调整这些参数，可以优化LLM输出的质量和创造性。最后，文章提供了实验性尝试的建议，帮助读者在特定任务中找到最佳参数配置。本文使用VLLM作为推理引擎，展示了Phi-3.5-mini-instruct模型的应用实例。

Deephub

135 6 6

sunrr

|

7月前

`save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

`save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

sunrr

77 2 2

嘟嘟嘟嘟嘟嘟

|

6月前

|

机器学习/深度学习人工智能 NoSQL

人工智能平台PAI产品使用合集之save_summary_steps这个配置项我设置了值为50，为什么还是1000个step才记录一次summaries

阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台，旨在降低AI开发门槛，加速创新，助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务，共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述，涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

嘟嘟嘟嘟嘟嘟

225 1 1

阿旭算法与机器学习

|

6月前

yolov8在进行目标追踪时，model.track()中persist参数的含义

yolov8在进行目标追踪时，model.track()中persist参数的含义

阿旭算法与机器学习

231 0 0

使者大牙

|

7月前

|

机器学习/深度学习 PyTorch 算法框架/工具

通过实例学习Pytorch加载权重.load_state_dict()与保存权重.save()

通过实例学习Pytorch加载权重.load_state_dict()与保存权重.save()

使者大牙

98 0 0

星辰同学wwq

|

机器学习/深度学习并行计算图计算

超参数设定及训练技巧

超参数设定及训练技巧

星辰同学wwq

367 0 0

zhang13365909307

ALLEN BRADLEY 842E-CM-MIP3BA 保留原始流中存在的所有信息

ALLEN BRADLEY 842E-CM-MIP3BA 保留原始流中存在的所有信息

zhang13365909307

95 0 0

ALLEN BRADLEY 842E-CM-MIP3BA 保留原始流中存在的所有信息

热门文章

最新文章

docker容器里安装ssh

优秀的代码都是如何分层的？

RDS入门——Excel文件转存到RDS数据库实践

3、Python与设计模式--建造者模式

PostgreSQL SQL HINT的使用

跟阿里云技术专家阙寒一起深度了解视频直播CDN技术

AjaxFileUploader上传插件兼容性好

（转载）数组a[]={3,5,2,4,1,8}，要求从a中找出所有“和”等于10的子集

SAP WM Movement Type Mail Control for Background processing

Ext 4 概述（七）之面板Panel & 杂项

自学记录HarmonyOS Next DRM API 13：构建安全的数字内容保护系统

《MaxFrame：数据处理的卓越实践与提升》

《DataWorks：数据处理的卓越实践与改进思考》

三维球体空间中光线反射模拟与三维点云提取matlab仿真

《多模态数据信息提取解决方案的体验与部署》

基于PSO优化的PV光伏发电系统simulink建模与仿真

数据链中常见电磁干扰matlab仿真,对比噪声调频,线性调频,噪声,扫频,灵巧五种干扰模型

《破局之路：人工智能产业的健康发展》

《强化学习算法在动态环境中的优化之路》

《大模型训练成本高，如何在不牺牲性能的前提下破局》

相关电子书

更多

低代码开发师（初级）实战教程

冬季实战营第三期：MySQL数据库进阶实战

阿里巴巴DevOps 最佳实践手册

下一篇

手把手教你白嫖阿里云服务器(免费领服务器)