备案控制台

开发者社区 ModelScope模型即服务计算机视觉正文

ModelScope-14b,怎么做预训练？

ModelScope-14b,怎么做预训练？

展开

收起

真的很搞笑 2023-10-08 19:11:31 232 版权

2 条回答

写回答

取消提交回答

Kinging

您好，您可以在阿里云的通义千问大模型系列的140亿参数规模的模型Qwen-14B上进行预训练。Qwen-14B是基于Transformer的大语言模型，在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。

2023-10-12 16:25:20

赞同展开评论
sunrr
在ModelScope平台上，预训练一个模型通常需要以下几个步骤：
1. 选择一个模型：首先，你需要在ModelScope的模型列表中选择你想要预训练的模型。
2. 下载模型：点击模型详情页面的“Download”按钮，下载模型的Python文件。
3. 安装依赖项：打开下载的Python文件，通常会有一个名为“requirements.txt”的文件，里面列出了模型运行所需的Python库。你需要使用pip来安装这些库。
4. 准备数据：预训练一个模型需要大量的标注数据。你需要准备这些数据，并将它们放在适合的数据格式中。
5. 运行预训练脚本：在下载的Python文件中，应该有一个名为“pre-training.py”或者“train.py”的文件，这个文件包含了预训练模型的代码。你需要在命令行中运行这个脚本。
6. 监控预训练过程：预训练一个模型可能需要一段时间，你需要监控预训练的过程，确保它没有出错。
7. 评估预训练结果：预训练完成后，你需要使用一些指标来评估预训练的结果，比如准确率、召回率等。
2023-10-10 12:47:25

赞同展开评论

相关问答

对modelscope的实体命名预训练模型进行微调上出现错误

305

1

0

modelscope的 StructBERT的中文Base预训练模型有关系吗？

121

0

0

ModelScope中damofd_34G_kps预训练模型如何下载呢？

82

0

0

官方ModelScope是没有对qwen模型进行“二次预训练”的文档吗？

105

1

0

需求是对qwen1.5-14B-chat进行二次预训练，有没有相关ModelScope文档？

129

1

0

ModelScope中，instruct数据不好构造，是不是可以继续预训练？大概需要多少数据量？

149

1

0

请问modelscope的samberthifigan语音合成多人预训练24K，要怎么更换发音人？

187

1

0

modelscope模型的最大token 能通过预训练整大点吗?

70

1

0

链接中的modelscope预训练是不是不需要query，就是扔给模型一大堆的训练语料就可以？

74

1

0

ModelScope训练某个垂直行业，目前使用chat模型，有必要做预训练吗？

134

0

0

ModelScope模型即服务

计算机视觉

包含图像分类、图像生成、人体人脸识别、动作识别、目标分割、视频生成、卡通画、视觉评价、三维视觉等多个领域

我要提问

相关文章

FFmpeg 官方汇编课程：写出快 5 倍的视频处理代码

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

程序员都在偷偷用的AI编程神器！2025高效自动写代码工具全解析

实力强劲的机器视觉公司有哪些：2025年TOP5精选榜单

2025 年度机器视觉公司有哪些：从技术实力到落地案例的全方位选型参考

热门讨论

热门文章

我希望通过damo-YOLO训练1500*1500的图片

ModelScope中，模型下载默认路径在哪个路径？

ModelScope下载速度慢怎么解决？

如何下载modelscope模型？

com/action/joingroup?code=v1是什么意思

服务器上onnxruntime-gpu 调用结束，如何释放显存

在ModelScope中，下载模型时的ssl问题怎么解决？!

modelscope这个下载有点慢呀，好几次都超时了，怎么解决？

ModelScope通义千问是多大的模型参数，收费标准跟7B有差距吗？

ModelScope的PAI-DSW中，怎么上传一个文件夹？

展开全部

Qwen2.5-VL：阿里通义千问最新开源视觉语言模型，能够理解超过1小时的长视频

Manga Image Translator：开源的漫画文字翻译工具，支持多语言翻译并嵌入原图，保持漫画的原始风格和布局

video-analyzer：开源视频分析工具，支持提取视频关键帧、音频转录，自动生成视频详细描述

LHM：单图生成3D动画人！阿里开源建模核弹，高斯点云重构服装纹理

X-AnyLabeling：开源的 AI 图像标注工具，支持多种标注样式，适于目标检测、图像分割等不同场景

AddressCLIP：一张照片就能准确定位！中科院联合阿里云推出街道级图像地理定位模型

SPAR3D：一张图片就能生成3D模型，每个物体的重建时间仅需0.7秒！

STAR：南京大学联合字节开源视频超分辨率增强生成框架，视频清晰度一键提升，支持从低分辨率视频生成高分辨率视频

InvSR：开源图像超分辨率生成模型，提升分辨率，修复老旧照片为超清图像

【Github热门项目】DeepSeek-OCR项目上线即突破7k+星！突破10倍无损压缩，重新定义文本-视觉信息处理

展开全部

还有其他疑问?