ModelScope中,能帮忙看下吗?使用的gpu的方式也报错

ModelScope中,能帮忙看下吗?使用的gpu的方式也报错image.pngb2c6ffee4fd08146b0ef8ed53e5e38af.png

展开
收起
多麻辣哦 2023-11-01 16:50:26 118 分享 版权
2 条回答
写回答
取消 提交回答
  • 在ModelScope中,如果使用GPU的方式遇到报错,可能的原因有几种。首先,这个错误可能表示在使用ModelScope进行弹性加速计算(EAIS)时,没有可用的CUDA内核图像来执行作业。其次,可能是因为您的GPU上没有安装适当版本的CUDA驱动程序,或者您的作业不兼容当前GPU上的CUDA版本。

    对于这种情况,您可以尝试以下解决方案:

    1. 确保正确安装了适当版本的CUDA驱动程序和相应的GPU驱动程序。您可以从NVIDIA官方网站上下载并安装最新版本的驱动程序。
    2. 检查您的作业是否兼容当前GPU上的CUDA版本。您可以查看ModelScope中的GPU信息,并检查所使用的CUDA版本。如果您的作业需要更高版本的CUDA,请尝试更新驱动程序并重新运行作业。
    3. 如果以上解决方案均未解决问题,请尝试重新安装ModelScope和相关组件,以确保所有组件都是最新版本。
    2023-11-02 10:39:21
    赞同 展开评论
  • 您跑一下这段代码:
    import os.path as osp
    from modelscope.metainfo import Trainers
    from modelscope.trainers import build_trainer
    from modelscope.msdatasets import MsDataset
    from modelscope.utils.constant import DownloadMode

    Step 1: 数据集准备,可以使用modelscope上已有的数据集,也可以自己在本地构建COCO数据集

    train_dataset = MsDataset.load('person_detection_for_train', namespace="modelscope", split='train', download_mode=DownloadMode.FORCE_REDOWNLOAD)您参考一下贡献者指南https://modelscope.cn/docs/ModelScope%E6%A8%A1%E5%9E%8B%E6%8E%A5%E5%85%A5%E6%B5%81%E7%A8%8B%E6%A6%82%E8%A7%88
    val_dataset = MsDataset.load('person_detection_for_train', namespace="modelscope", split='validation', download_mode=DownloadMode.FORCE_REDOWNLOAD)

    Step 2: 相关参数设置

    train_root_dir = train_dataset.config_kwargs['split_config']['train']
    val_root_dir = val_dataset.config_kwargs['split_config']['validation']
    train_img_dir = osp.join(train_root_dir, 'images')
    val_img_dir = osp.join(val_root_dir, 'images')
    train_anno_path = osp.join(train_root_dir, 'train.json')
    val_anno_path = osp.join(val_root_dir, 'val.json')
    kwargs = dict(
    model='damo/cv_tinynas_object-detection_damoyolo',
    gpu_ids=[ # 指定训练使用的gpu
    0,
    ],
    batch_size=2,
    max_epochs=3,
    num_classes=1, # 自定义数据中的类别数
    train_image_dir=train_img_dir, # 训练图片路径
    val_image_dir=val_img_dir, # 测试图片路径
    train_ann=train_anno_path, # 训练标注文件路径
    val_ann=val_anno_path, # 测试标注文件路径
    )
    trainer = build_trainer(
    name=Trainers.tinynas_damoyolo, default_args=kwargs)
    trainer.train() # 训练log将会保存在./workdirs/damoyolo_s/train_log.txt———此回答整理自钉群:魔搭ModelScope开发者联盟群 ①

    2023-11-01 21:00:30
    赞同 展开评论

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

热门讨论

热门文章

还有其他疑问?
咨询AI助理