备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope的OpenBuddy-LLaMA2-70B模型微调后怎么指定需要问的问题推理？

请问ModelScope的OpenBuddy-LLaMA2-70B模型微调后，在推理这部分我怎么指定给他输入需要问的问题进行推理呢？我试了一下OpenBuddy-LLaMA2-70B模型微调后使用单样本推理，但是爆显存了，显卡配置是3090 24G，请问有什么办法能在这个配置上跑动推理嘛？还有这部分微调我是使用了自定义数据集进行微调的，这个也会影响我这边单样本推理嘛？

展开

收起

陈幕白 2023-12-13 16:39:41 168 版权

1 条回答

写回答

取消提交回答

顾九思

单样本推理 https://github.com/modelscope/swift/blob/main/docs/source/LLM/LLM%E5%BE%AE%E8%B0%83%E6%96%87%E6%A1%A3.md 要参考LLM推理文档中的量化。另外sft.sh没有model_type，cpu试一下看看会不会报错。麻烦您看一下这个模型openbuddy-llama2-70b-chat， swift 微调之后单样本推理时报错此回答整理自钉群 “魔搭ModelScope开发者联盟群 ①”

2023-12-13 17:04:05

赞同展开评论

相关问答

微调llama3时报modelscope - ERROR错，能帮忙看一下什么问题吗

221

1

0

modelscope-funasr使用微调后，效果不好，如何提高模型准确率？

224

0

0

modelscope-funasr这个中文模型在使用过程中推理结果会识别出现英文，为什么？

150

1

0

为什么我微调modelscope大模型时报错，让我升级内核啊？能升级吗？

153

1

0

modelscope-funasr中如果用10小时数据做微调， 2张T4的卡，大概耗时多久？

179

1

0

ModelScope推理时，--max_new_tokens和--max_length有什么区别？

533

1

0

ModelScope有没有对各种大模型使用各种微调方法所需要显存的统计？

156

1

0

modelscope-funasr能推理网络地址的音频文件么？

106

0

0

modelscope推理报错 swift infer 是啥问题呢？

213

1

0

modelscope的自然语言推理或通用信息提取能做到下文理解吗？

86

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

阿里云服务器官网链接，多款云服务器入口大全，一篇文章搞定！

从代码到生产推理服务：DevPod 全流程部署 DeepSeek-OCR 模型实战指南

从 50 步到 4 步：LightX2V 如何把视频生成拉进20 秒时代？

AI测试开发工程师面试指南：20个核心技术问题及思路解析

基于变密度法的多相拓扑优化MATLAB实现

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，下载模型时的ssl问题怎么解决？!

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

展开全部

还有其他疑问?