文档备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练

ModelScope通过GPT-3中文2.7B模型在诗词生成数据集上二次开发训练，训练出的模型预测时报这个，请问有解决方式吗，训练过程没报错，模型文件夹：

展开

收起

真的很搞笑 2023-03-22 15:48:03 664 版权

2 条回答

写回答

取消提交回答

哈哈是我

数据集准备：为了在GPT-3中文模型上进行二次开发和训练，首先需要准备一个高质量的诗词数据集。数据集应该包含大量标准化的诗词文本，且格式一致，方便模型学习。

环境设置：确保您有权访问ModelScope平台，并且已经设置了必要的开发环境，包括安装了所需的软件包和库。

模型加载：在ModelScope平台上加载GPT-3中文2.7B模型。通常，这可以通过ModelScope提供的API或者SDK来完成。

二次训练：在现有GPT-3中文模型的基础上，使用您准备的诗词数据集来进行二次训练。这通常涉及到设置训练参数，如学习率、批次大小、训练轮数等。

训练过程监控：在训练过程中，监控模型的性能，确保模型在学习过程中没有过拟合或者欠拟合。可以通过设置验证集来评估模型在训练过程中的表现。

优化和调整：根据模型在训练过程中的表现，可能需要对模型的架构或训练参数进行调整，以达到更好的效果。

测试和评估：用另一组数据进行测试，评估模型的诗词生成能力。可以使用诗词质量、创新性、韵律等标准来评价生成的诗词。

模型部署：一旦模型训练完成并通过测试，就可以部署模型，使其可以响应用户的请求进行诗词生成。

2024-02-23 16:31:02

赞同 1 展开评论
co63oc_

GitHub https://github.com/co63oc/cloud

模型shape不同

2023-03-24 17:18:24

赞同展开评论

相关问答

ModelScope为啥使用notebook的cpu版本，finetune.sh脚本去训练一直失败？

340

1

0

modelscope这个古诗数据集我要不要把分隔符定义为'\n'?

173

1

0

我可否先在网上下载数据集，然后替换到modelscope文件里面?

372

1

0

从modelscope下载数据集后很乱？

473

1

0

ModelScope中我的数据集dataset_infos.json文件被管理员删除是什么问题？

259

1

0

在modelscope-funasr中训练数据时长和训练时长有没有一个估算公式？

290

0

0

如何实例化一个聊天模型，并指定使用GPT-4？

303

1

0

训练一个GPT-3模型大概需要多少计算量和算力？

2711

3

0

在GPT等大模型的加持下，新必应带来了哪些变革？

232

2

0

ARTIST模型如何通过GPT生成图像序列？

232

1

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

收录在圈子:

计算机视觉

171

+ 订阅

相关文章

AI短剧/AI广告生成实战流程：阿里云百炼新上线的HappyHorse 1.1功能详解、参数调试、成本指南

历史科普视频的AI自动化生产工作流：从全手动到半自动的工程演进

测试一下发文章

甲醛 (HCHO) 总柱扫描轨道

浏览器端 AI 视频人物描边实践：MODNet、SlimSAM、MediaPipe 与光流融合方案

相关解决方案

更多

基于 Spark 和 PyTorch 的模型训练方案

一键训练模型及部署GPU共享推理服务

GLM-5.2：长任务时代开源旗舰模型

OpenAI 重磅开源，快速部署GPT-OSS模型

模型蒸馏：让0.6B模型媲美235B模型

热门讨论

热门文章

com/action/joingroup?code=v1是什么意思

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

ModelScope的readme文件点选编辑但仍然提示readme文件缺失license等信息？

ModelScope这个免费额度可以在哪里查询啊？

如何下载modelscope模型？

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

请问Modelscope互联网如何访问Notebook的服务呢？

在ModelScope中，下载模型时的ssl问题怎么解决？!

modelscope我想请问存在pytorch与CUDA驱动版本冲突的问题么？

展开全部

See3D：智源研究院开源的无标注视频学习 3D 生成模型

video-subtitle-remover（VSR）--开源AI去字幕方案深度解析

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

ColorFlow：腾讯和清华大学联合推出的图像序列着色模型，通过参考图像的颜色对黑白漫画进行着色生成彩色漫画

AniDoc：蚂蚁集团开源 2D 动画上色 AI 模型，基于视频扩散模型自动将草图序列转换成彩色动画，保持动画的连贯性

ViTPose：最小只有100M的身体姿态估计模型，精确识别人体关节、手、脚等关键点

FlashVideo：生成1080p视频仅需102秒，字节联合港大推出低成本高分辨率视频生成框架

极致的显存管理！6G显存运行混元Video模型

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

展开全部

还有其他疑问?