开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

机器学习PAI每次训练都要新建一个目录吗?

机器学习PAI每次训练都要新建一个目录吗?我看之前的checkpoint在的话,模型会加载起来继续train。有没有办法restart?没找到相关的参数。

展开
收起
cuicuicuic 2023-11-30 11:13:40 26 0
4 条回答
写回答
取消 提交回答
  • 在使用机器学习PAI进行训练时,并不需要每次都新建一个目录。您可以在一个固定的目录下进行多次训练,但需要注意的是,每次训练的结果会对应一个新的子目录。例如,当您第一次训练一个模型时,结果将会被保存在指定的主目录下的一个以日期为名称的子目录中。而当您再次进行训练时,即使使用了相同的配置和数据,结果也会被保存在另一个以新的日期为名称的子目录中。这种方式有助于有效地管理和组织训练结果

    2023-12-05 10:00:58
    赞同 展开评论 打赏
  • 试一下这个参数:https://github.com/alibaba/EasyRec/blob/master/pai_jobs/run.py#L174
    689adab65eed6457f5144b48496e5c66.png
    写在 Dextra_params= 后面,此回答整理自钉群“【EasyRec】推荐算法交流群”

    2023-11-30 20:57:08
    赞同 展开评论 打赏
  • 面对过去,不要迷离;面对未来,不必彷徨;活在今天,你只要把自己完全展示给别人看。

    在机器学习 PAI 中,每次训练都不一定需要新建一个目录。通常情况下,您可以选择将训练相关的文件和资源保存在同一个目录中,以便于管理和追溯。

    以下是一些常见的做法:

    1. 创建一个独立的项目目录:在开始训练之前,您可以为每个机器学习项目创建一个独立的目录。这个目录可以包含数据集、代码文件、模型配置和训练日志等。这样可以使项目文件更加整洁和有组织。

    2. 使用时间戳或版本号:如果您希望跟踪不同训练过程的结果,可以将时间戳或版本号作为目录名的一部分。例如,每次训练时根据当前时间创建一个新的目录,或者使用自定义的版本号标识每个训练实验。

    3. 利用参数化路径:在 PAI 平台上,您可以通过指定参数化的目录路径来动态创建和管理训练目录。例如,使用命令行参数、脚本变量或配置文件配置训练目录的路径,以便每次训练时自动创建一个新的目录。

    2023-11-30 14:16:09
    赞同 展开评论 打赏
  • 天下风云出我辈,一入江湖岁月催,皇图霸业谈笑中,不胜人生一场醉。

    在机器学习PAI中,每次训练都需要新建一个目录。如果之前有训练记录的话,模型会加载起来继续训练,而不会覆盖之前的训练记录。需要重新开始训练,可以通过清空目录的方式来进行。
    具体操作是在命令行中输入

    pai clear
    

    来清空当前目录中的所有数据和配置文件,然后重新运行训练脚本即可。
    在已有的训练记录上进行restart,您可以使用以下命令来恢复之前的训练状态:

    pai restore -project algo_public -name <modelName> -config <configPath> -d <input_dir> -d <output_dir> -s <model_checkpoint>
    

    modelName是模型名称,configPath是配置文件路径,input_dir和output_dir是训练数据和模型输出的路径,model_checkpoint是之前训练的模型保存路径。image.png

    ---来自人工智能平台 PAI使用EasyRec构建推荐模型

    2023-11-30 13:57:04
    赞同 展开评论 打赏

热门讨论

热门文章

相关电子书

更多
大规模机器学习在蚂蚁+阿里的应用 立即下载
阿里巴巴机器学习平台AI 立即下载
机器学习及人机交互实战 立即下载