热门
ModelScope微调(qlora+ddp)+推理 qwen-7b, 需要4卡*16GB显存.
新手玩家,没有这么多显卡啊?PAI-DSW的GPU也不够呀,那我还是继续等它吧
嗯嗯好嘞,其实lora系列 收敛很快的,不需要那么多迭代步数,1000步差不多了。
你可以观察一下loss,差不多了就可以停了,此回答整理自钉群“魔搭ModelScope开发者联盟群 ①”
包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域