开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 正文

请问黑盒化加速如何配置Rapidformer的启动训练CLI?

已解决

请问黑盒化加速如何配置Rapidformer的启动训练CLI?

展开
收起
felix@ 2023-01-28 20:13:41 1647 0
2 条回答
写回答
取消 提交回答
  • 今天也要加油吖~
    采纳回答

    您好,可以这样配置:

    #!/bin/bash
    export CUDA_VISIBLE_DEVICES=4,5,6,7
    export MASTER_ADDR=localhost
    export MASTER_PORT=6010
    export NNODES=1
    export NODE_RANK=0
    
    rapidformer --task pretraining \
           --pretrained-model-name-or-path 'bert-base-uncased' \
           --num-layers 12 \
           --hidden-size 768 \
           --num-attention-heads 12 \
           --micro-batch-size 16 \
           --global-batch-size 128 \               #开启梯度累积
           --seq-length 512 \
           --tokenizer-type BertWordPieceLowerCase \
           --max-position-embeddings 512 \
           --train-iters 100 \
           --data-path book_wiki_owtv2_small_text_sentence \
           --vocab-file bert-en-uncased-vocab.txt  \
           --data-impl mmap \
           --split 980,20 \
           --lr 1e-3 \
           --lr-decay-style linear \
           --min-lr 0.0 \
           --lr-decay-iters 2000 \
           --weight-decay 1e-2 \
           --clip-grad 1.0 \
           --lr-warmup-fraction .01 \
           --mixed-precision \                    #开启混合精度训练
           --onnx-runtime-training \              #开启计算图优化
           --fsdp-memory-optimization \           #开启模型状态切分优化
    
    2023-01-28 20:17:02
    赞同 展开评论 打赏
  • 黑盒化加速可以通过Rapidformer的CLI来实现。Rapidformer提供了一个命令行工具,可以用来配置Rapidformer的启动训练CLI,从而实现黑盒化加速。可以使用以下命令来配置Rapidformer的启动训练CLI:

    rapidformer train --config <config_file> --model <model_file> --data <data_file> --output <output_file>
    
    2023-01-28 21:21:17
    赞同 展开评论 打赏

人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载