请问黑盒化加速如何配置Rapidformer的启动训练CLI?
您好,可以这样配置:
#!/bin/bash
export CUDA_VISIBLE_DEVICES=4,5,6,7
export MASTER_ADDR=localhost
export MASTER_PORT=6010
export NNODES=1
export NODE_RANK=0
rapidformer --task pretraining \
--pretrained-model-name-or-path 'bert-base-uncased' \
--num-layers 12 \
--hidden-size 768 \
--num-attention-heads 12 \
--micro-batch-size 16 \
--global-batch-size 128 \ #开启梯度累积
--seq-length 512 \
--tokenizer-type BertWordPieceLowerCase \
--max-position-embeddings 512 \
--train-iters 100 \
--data-path book_wiki_owtv2_small_text_sentence \
--vocab-file bert-en-uncased-vocab.txt \
--data-impl mmap \
--split 980,20 \
--lr 1e-3 \
--lr-decay-style linear \
--min-lr 0.0 \
--lr-decay-iters 2000 \
--weight-decay 1e-2 \
--clip-grad 1.0 \
--lr-warmup-fraction .01 \
--mixed-precision \ #开启混合精度训练
--onnx-runtime-training \ #开启计算图优化
--fsdp-memory-optimization \ #开启模型状态切分优化
黑盒化加速可以通过Rapidformer的CLI来实现。Rapidformer提供了一个命令行工具,可以用来配置Rapidformer的启动训练CLI,从而实现黑盒化加速。可以使用以下命令来配置Rapidformer的启动训练CLI:
rapidformer train --config <config_file> --model <model_file> --data <data_file> --output <output_file>
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
人工智能平台 PAI(Platform for AI,原机器学习平台PAI)是面向开发者和企业的机器学习/深度学习工程平台,提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务,内置140+种优化算法,具备丰富的行业场景插件,为用户提供低门槛、高性能的云原生AI工程化能力。