备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练

ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练，训练出的模型预测时报这个，请问有解决方式吗，训练过程没报错，模型文件夹：

展开

收起

真的很搞笑 2023-03-22 15:48:03 441 版权

2 条回答

写回答

取消提交回答

哈哈是我

数据集准备：为了在GPT-3中文模型上进行二次开发和训练，首先需要准备一个高质量的诗词数据集。数据集应该包含大量标准化的诗词文本，且格式一致，方便模型学习。

环境设置：确保您有权访问ModelScope平台，并且已经设置了必要的开发环境，包括安装了所需的软件包和库。

模型加载：在ModelScope平台上加载GPT-3中文2.7B模型。通常，这可以通过ModelScope提供的API或者SDK来完成。

二次训练：在现有GPT-3中文模型的基础上，使用您准备的诗词数据集来进行二次训练。这通常涉及到设置训练参数，如学习率、批次大小、训练轮数等。

训练过程监控：在训练过程中，监控模型的性能，确保模型在学习过程中没有过拟合或者欠拟合。可以通过设置验证集来评估模型在训练过程中的表现。

优化和调整：根据模型在训练过程中的表现，可能需要对模型的架构或训练参数进行调整，以达到更好的效果。

测试和评估：用另一组数据进行测试，评估模型的诗词生成能力。可以使用诗词质量、创新性、韵律等标准来评价生成的诗词。

模型部署：一旦模型训练完成并通过测试，就可以部署模型，使其可以响应用户的请求进行诗词生成。

2024-02-23 16:31:02

赞同 1 展开评论
co63oc_

GitHub https://github.com/co63oc/cloud

模型shape不同

2023-03-24 17:18:24

赞同展开评论

相关问答

ModelScope为啥使用notebook的cpu版本，finetune.sh脚本去训练一直失败？

141

1

0

modelscope训练完一直出现同一个错误怎么回事？

148

1

0

在modelscope-funasr中训练数据时长和训练时长有没有一个估算公式？

120

0

0

在modelscope-funasr中请问sensevoice微调时，训练数据怎么准备？

193

0

0

ModelScope 训练方式没有那种整理数据集的形势？

99

1

0

如何实例化一个聊天模型，并指定使用GPT-4？

116

1

0

训练一个GPT-3模型大概需要多少计算量和算力？

1909

3

0

在GPT等大模型的加持下，新必应带来了哪些变革？

82

2

0

ARTIST模型如何通过GPT生成图像序列？

93

1

0

GPT-4的多模态模型有什么特点？

98

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

OBS美颜美肌插件安装使用教程

AI Ping：精准可靠的大模型服务性能评测平台

Python图片上采样工具 - RealESRGANer

pytorch基于AnimeFace128数据集训练DCGAN

高效率办公PDF批量处理：批量OCR识别PDF区域文字内容，用PDF内容批量改名或导出表格的货物运单应用案例

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

我希望通过damo-YOLO训练1500*1500的图片

ModelScope下载速度慢怎么解决？

ModelScope中，大佬们4卡跑lora时，遇到这样的错，怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

在ModelScope中，下载模型时的ssl问题怎么解决？!

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

cpu部署报错 Torch not compiled with CUDA enabled

modelscope cache 环境变量是啥？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

RF-DETR：YOLO霸主地位不保？开源 SOTA 实时目标检测模型，比眨眼还快3倍！

JoyCaption：开源的图像转提示词生成工具，支持多种风格和场景，性能与 GPT4o 相当

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

Cobalt：开源的流媒体下载工具，支持解析和下载全平台的视频、音频和图片，支持多种视频质量和格式，自动提取视频字幕

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

UI-TARS：字节跳动开源专注于多平台 GUI 自动化交互的视觉语言模型

展开全部

还有其他疑问?