开发者社区 > ModelScope模型即服务 > 正文

ModelScope中,使用sft.sh 如何使用TensorBoard?

ModelScope中,使用sft.sh 如何使用TensorBoard?

展开
收起
小小爱吃香菜 2024-03-27 08:50:06 66 0
4 条回答
写回答
取消 提交回答
  • 在ModelScope中,使用sft.sh脚本结合TensorBoard进行模型训练的监控和可视化,通常需要遵循以下步骤:

    1. 环境配置:确保您有一个支持的训练环境,Python版本至少为.8,并且已经安装了TensorBoard。
    2. 启动TensorBoard:在终端或命令提示符中运行tensorboard --logdir=<directory_name>命令,将<directory_name>替的目录名称。如果您想通过网络访问TensorBoard,可以使用--bind_all选项。
    3. 查看TensorBoard:运行上述命令后,TensorBoard将在默认端口6006上提供服务。您可以在浏览器中输入localhost:6006来查看TensorBoard界面。
    4. 使用TensorBoard:在TensorBoard中,您可以查看模型结构、监控训练过程中的各项指标、检查数据和评估模型性能等。这些都是通过可视化的方式呈现,帮助您更好地理解模型的训练状态和性能表现。
    5. 结合sft.sh脚本:在使用sft.sh脚本进行模型训练时,您可以通过添加相应的参数来指定TensorBoard的日志目录,以便在训练过程中生成的日志信息能够被TensorBoard读取和展示。例如,您可以在sft.sh脚本中使用--log_dir参数来设置日志目录的路径。
    6. 微调类型选择:在使用sft.sh脚本进行模型微调时,您可以通过--sft_type参数来选择微调的方式,比如'lora'、'full'等。
    7. 数据集准备:如果您使用的是标准数据集,如Fashion-MNIST,可以通过torchvision.datasets直接读入PyTorch。对于自定义数据集,您需要按照TensorBoard的要求准备和处理数据。

    综上所述,通过以上步骤,您可以在ModelScope中使用sft.sh脚本结合TensorBoard进行模型训练的监控和可视化。这样不仅可以帮助您更直观地了解模型的训练进度和性能,还可以在训练完成后对模型进行评估和优化。

    2024-03-29 16:35:23
    赞同 展开评论 打赏
  • 在ModelScope中,使用sft.sh脚本时,可以通过添加参数来启用TensorBoard。具体步骤如下:

    1. 启动训练:确保你已经设置了正确的环境,并且在命令行中运行sft.sh脚本来启动模型的微调或训练。
    2. 添加参数:在sft.sh命令中添加--tard参数,以便在训练过程中启用TensorBoard。例如,你的命令可能看起来像这样:python sft.sh --model_id_or_path=your_model_path --tensorboard
    3. 查看日志:训练开始后,TensorBoard会自动启动,并在终端输出中显示一个URL,通常是http://localhost:6006,你可以在浏览器中打开这个URL来查看TensorBoard的界面。
    4. 监控训练:在TensorBoard中,你可以实时监控训练的各项指标,如损失函数、准确率等,以及模型的权重分布和梯度变化。

    请注意,如果你的模型是在一个云服务器上运行,你可能需要将TensorBoard暴露给外部网络或者通过SSH隧道等方式来访问它。此外,确保你的环境满足运行TensorBoard的要求,比如Python版本需要大于或等于3.8。如果在使用过程中遇到任何问题,可以查看sft.sh的详细命令行参数说明,或者寻求社区的帮助。

    2024-03-27 18:23:21
    赞同 展开评论 打赏
  • 用tensorboard命令打开runs下的文件即可。此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”

    2024-03-27 12:46:50
    赞同 展开评论 打赏
  • 阿里云大降价~

    在ModelScope中,使用sft.sh脚本来利用TensorBoard进行模型训练的监控和可视化,通常需要遵循以下步骤:

    1. 环境配置:确保您有一个支持的训练环境,包括Python版本至少为3.8,并且已经安装了TensorBoard。如果您使用的是阿里云ECS,建议在4*V100的配置下运行。
    2. 启动训练:在启动模型训练时,您需要使用sft.sh脚本,并通过命令行参数指定模型的ID或路径。如果model_id_or_path为None或者是本地的模型目录,则该参数失效。
    3. TensorBoard集成:在sft.sh脚本中,应该有选项来启用TensorBoard。如果没有,您可能需要查看具体的参数介绍,以便了解如何集成TensorBoard。
    4. 日志目录:TensorBoard通常需要一个日志目录来存储训练过程中的日志信息。确保在启动sft.sh时,指定了正确的日志目录。
    5. 访问TensorBoard:一旦训练开始,您可以通过访问特定的端口(默认是6006)在浏览器中查看TensorBoard的界面。通常,您可以通过访问http://localhost:6006来查看TensorBoard。
    6. 监控训练过程:在TensorBoard中,您可以实时监控模型的训练进度、损失函数的变化、准确率等重要指标。
    7. 调整参数:如果需要,您可以根据TensorBoard显示的信息调整模型的超参数或训练配置。

    请注意,上述步骤是基于一般情况下的使用流程,具体操作可能会根据ModelScope的版本和配置有所不同。如果在操作过程中遇到问题,建议查阅ModelScope的官方文档或寻求社区支持。

    2024-03-27 09:19:12
    赞同 展开评论 打赏

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!欢迎加入技术交流群:微信公众号:魔搭ModelScope社区,钉钉群号:44837352

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载