ModelScope中,能帮忙看下吗?使用的gpu的方式也报错
在ModelScope中,如果使用GPU的方式遇到报错,可能的原因有几种。首先,这个错误可能表示在使用ModelScope进行弹性加速计算(EAIS)时,没有可用的CUDA内核图像来执行作业。其次,可能是因为您的GPU上没有安装适当版本的CUDA驱动程序,或者您的作业不兼容当前GPU上的CUDA版本。
对于这种情况,您可以尝试以下解决方案:
您跑一下这段代码:
import os.path as osp
from modelscope.metainfo import Trainers
from modelscope.trainers import build_trainer
from modelscope.msdatasets import MsDataset
from modelscope.utils.constant import DownloadMode
train_dataset = MsDataset.load('person_detection_for_train', namespace="modelscope", split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD)您参考一下贡献者指南https://modelscope.cn/docs/ModelScope%E6%A8%A1%E5%9E%8B%E6%8E%A5%E5%85%A5%E6%B5%81%E7%A8%8B%E6%A6%82%E8%A7%88
val_dataset = MsDataset.load('person_detection_for_train', namespace="modelscope", split='validation', download_mode=DownloadMode.FORCE_REDOWNLOAD)
train_root_dir = train_dataset.config_kwargs['split_config']['train']
val_root_dir = val_dataset.config_kwargs['split_config']['validation']
train_img_dir = osp.join(train_root_dir, 'images')
val_img_dir = osp.join(val_root_dir, 'images')
train_anno_path = osp.join(train_root_dir, 'train.json')
val_anno_path = osp.join(val_root_dir, 'val.json')
kwargs = dict(
model='damo/cv_tinynas_object-detection_damoyolo',
gpu_ids=[ # 指定训练使用的gpu
0,
],
batch_size=2,
max_epochs=3,
num_classes=1, # 自定义数据中的类别数
train_image_dir=train_img_dir, # 训练图片路径
val_image_dir=val_img_dir, # 测试图片路径
train_ann=train_anno_path, # 训练标注文件路径
val_ann=val_anno_path, # 测试标注文件路径
)
trainer = build_trainer(
name=Trainers.tinynas_damoyolo, default_args=kwargs)
trainer.train() # 训练log将会保存在./workdirs/damoyolo_s/train_log.txt———此回答整理自钉群:魔搭ModelScope开发者联盟群 ①