save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

简介: save_summary_steps`这个参数是用来控制训练过程中保存摘要的频率的

save_summary_steps这个参数是用来控制训练过程中保存摘要的频率的。默认情况下,每1000个步骤会保存一次摘要。如果你将其设置为50,那么理论上应该每50个步骤就会保存一次摘要。

然而,这并不意味着每次保存摘要时都会进行一次评估。评估是在每个评估周期(eval_steps)进行的,而不是在每个保存摘要的步骤。所以,如果你的eval_steps设置为1000,那么每1000个步骤才会进行一次评估。

至于你提到的eval_resultsglobal_step达到1000后就不再为空,这可能是因为在训练开始时,模型还没有开始进行评估,所以eval_results为空。当global_step达到1000时,模型已经进行了第一次评估,所以eval_results就不再为空了。

如果你希望更频繁地进行评估,可以考虑减小eval_steps的值。但是请注意,频繁的评估可能会增加训练的时间,因为每次评估都需要对整个数据进行前向传播。

目录
相关文章
|
机器学习/深度学习 人工智能 安全
大模型的安全对齐技术
大模型的安全对齐技术
909 1
大模型的安全对齐技术
|
机器学习/深度学习
Transformer模型中前置Norm与后置Norm的区别
Transformer模型中前置Norm与后置Norm的区别
510 2
|
Android开发 开发者
【Magisk模块】Miui Core:在非MIUI系统上运行MIUI服务框架(V2.7)
【Magisk模块】Miui Core:在非MIUI系统上运行MIUI服务框架(V2.7)
3896 0
|
12月前
|
监控 Shell 数据处理
Python执行Shell并获取结果的全面指南
Python执行Shell并获取结果的全面指南
748 1
|
12月前
|
存储 前端开发 API
前端开发中,Web Storage的存储数据的方法localstorage和sessionStorage的使用及区别
前端开发中,Web Storage的存储数据的方法localstorage和sessionStorage的使用及区别
426 0
|
JavaScript Java 测试技术
基于SpringBoot+Vue的旅游管理系统的设计与实现(源码+lw+部署文档+讲解等)
基于SpringBoot+Vue的旅游管理系统的设计与实现(源码+lw+部署文档+讲解等)
242 1
|
JavaScript 前端开发 数据安全/隐私保护
vue 前端 邮箱、密码、手机号码等输入验证规则
vue 前端 邮箱、密码、手机号码等输入验证规则
779 0
|
消息中间件 安全 Java
Java中的异步编程方案总结
Java中的异步编程是一种能够提高程序性能和响应速度的技术。它通过将耗时的操作放在单独的线程中,让主线程继续执行其他任务,从而实现并发处理和异步执行。在Java中,异步编程常用的方式有多线程、Future和CompletableFuture等。在实际应用中,异步编程可以优化网络请求、数据库操作等IO密集型任务的性能,提高程序的响应速度和吞吐量。虽然异步编程可以带来许多好处,但同时也涉及到一些问题,比如线程安全、回调地狱等。因此,在使用异步编程时需要注意合理地设计和管理线程,确保程序的正确性和可维护性。
724 1
Java中的异步编程方案总结
|
人工智能 自然语言处理 测试技术
GPT-4 API 接口调用及价格分析
对开发者来说,GPT-4最激动人心的是API接口同步发布。我今天获得了API访问权限,本文将跟大家分享GPT-4 API接口的使用以及大家关心的价格分析。
14618 1
GPT-4 API 接口调用及价格分析
|
数据可视化 PyTorch TensorFlow
在 CIFAR-10 数据集上使用最大均值差异(MMD)漂移检测器(Seldon Alibi Detect)(上)
方法 Maximum Mean Discrepancy (MMD)检测器是一种基于核的多元2样本测试方法。MMD是基于再生核希尔伯特空间 F 中的平均嵌入\mu_{p}μ p ​ 和\mu_{q}μ q ​ 的2个分布p和q之间的基于距离的度量: