备案控制台

开发者社区 ModelScope模型即服务文章正文

初次体验魔搭，问题一堆堆

2024-06-09 130

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

交互式建模 PAI-DSW，每月250计算时 3个月

模型训练 PAI-DLC，100CU*H 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

简介： 问题不少，可以提升的空间还很大

新注册了Modelscope的测试环境，主要目的是体验新发布的Qwen2模型，结果遇到了一堆问题:
1) Cuda out of memory的错误经常出现

粘贴GPT的回复如下:
模型大小和显存占用：
虽然模型文件大小为 16GB，但加载到显存中会有额外开销，例如中间激活值、优化器状态等。当前显存占用已经达到了 20.7GB（大部分是从大池分配），接近 24GB 显存的上限。
显存碎片化：

非可释放内存（约 174.5 MiB）表明显存可能存在碎片化问题，导致无法分配连续的大块内存。
分配和释放频率：

总分配量和总释放量很高，表明显存分配和释放操作频繁。这可能导致内存碎片化和管理开销增加。

尝试执行了torch.cuda.empty_cache()也不管用，重启kernel也不管用，
只能关掉NoteBook实例重新加载，但是错误依然会出现。

2）评测了一下文本生成视频的模型，发现语义理解能力相当差，只有例子中带的熊猫吃竹子的视频
基本靠谱，换成其他输入，例如:两只鸭子正在小池塘里安静的游动，生成的视频完全不着边际。。。

3) 司南评测里随便选了几个模型进行对比评测，发现code能力和GPT差的不是一星半点，最后只好放弃。

文章标签：

测试技术

自然语言处理

并行计算

大模型痛并快乐着

目录

相关文章

aliyun9861394983-11302

|

人工智能自然语言处理 Java

首次体验中文竞技场大模型体验！！！

我将分别从知识常识、中文游戏、NLP专业领域、代码相关、写作创作、人类价值观六大领域测评不同模型的效果，以及一些看法。

aliyun9861394983-11302

188 0 0

魔搭ModelScope社区小助手

|

13天前

|

物联网异构计算 Python

麦橘超然上线魔搭社区，免费生图和训练，文末返图有奖

麦橘超然是麦橘制作的基于Flux.1的模型，可以生成高度摄影写实和富有光影感的图片，尤其擅长表现人物的脸部和肌肤细节。麦橘之前的作品麦橘写实是各大文生图开源站点最受欢迎的模型之一。

魔搭ModelScope社区小助手

85 11 11

1864644596078247

|

2月前

初次体验通义灵码有感

初次体验通义，待工具越来越完善，原来需要自己做的事情会越来越少，开发也会变得更加简单

1864644596078247

42 2 3

想飞的雪糕

|

3月前

|

Serverless 数据安全/隐私保护前端开发

大模型代码能力体验报告之贪吃蛇小游戏《一》：Claude.ai篇 - 生成、预览和快速部署的serverless一条龙

本文介绍了通过Claude.ai生成并优化Web版贪吃蛇游戏的过程，展示了其强大的代码生成功能及用户友好的界面设计。从初始版本的快速生成到根据用户反馈调整游戏速度，再到提供多种实用工具如文件管理、版本控制和一键部署，Claude.ai不仅是一个代码助手，更像是一个全面的serverless开发平台。文中还呼吁国内厂商关注此类技术的发展。

想飞的雪糕

104 1 1

阿里云云原生

|

Kubernetes Cloud Native Serverless

在线找 K8s 学习搭子，急！

在线找 K8s 学习搭子，急！

阿里云云原生

245 0 0

阿里云企航

|

人工智能

AI起名，在线核名，免费体验！

一文解释公司核名常见问题问题，帮您的企业赢在起跑线！

阿里云企航

1077 0 0

kingtao_

|

文字识别自然语言处理

魔搭体验求助

运行ocr demo时报错,望大家协助结局~感谢~

kingtao_

435 0 4

zyuan09

|

NoSQL Java 中间件

阿里云首次体验

首次使用云的一些感想。

zyuan09

181 1 1

阿里云Serverless

|

关系型数据库 MySQL Serverless

【体验有奖】使用 Serverless 1 步搭建照片平台！

参与RDS MySQL Serverless实验，Get相册应用，赢AirPods！

阿里云Serverless

420 0 0

【体验有奖】使用 Serverless 1 步搭建照片平台！

aliyun6331811521

|

存储前端开发 Ubuntu

初次使用阿里云完成一个小项目的体验

作为一个非编程专业的学生，使用阿里云服务器对我的帮助很大，以下是我使用阿里云过程中的一些体验

aliyun6331811521

177 1 1

初次使用阿里云完成一个小项目的体验

ModelScope模型即服务

热门文章

最新文章

阿里云通义千问向全社会开放！

智胜未来：国内大模型+Agent应用案例精选，以及主流Agent框架开源项目推荐

Large Motion Model：多模态运动生成模型，能够同时处理文本、音乐、视频等多种模态生成相应的运动动作

CosyVoice 2.0：阿里开源升级版语音生成大模型，支持多语言和跨语言语音合成，提升发音和音色等的准确性

multi-agent：多角色Agent协同合作，高效完成复杂任务

实战阿里qwen2.5-coder 32B，如何配置Cline的Ollama API接口。

MiniCPM-o 2.6：流式全模态，端到端，多模态端侧大模型来了！

WeaveFox：蚂蚁集团推出 AI 前端智能研发平台，能够根据设计图直接生成源代码，支持多种客户端和技术栈

通义千问Qwen征文活动获奖公布

千问团队开源会思考的QwQ模型，这模型成精了！

大模型的综合分析报告

VITA-1.5: 迈向GPT-4o级实时视频-语音交互

多端圈子系统源码安装教程指南

通义千问团队开源全新的过程奖励模型PRM！

OpenCSG开源最大中文合成数据集Chinese Cosmopedia

魔搭社区每周速递（1.5-1.18）

ModelScope魔搭25年1月版本发布月报

设计：智能医疗设备管理系统——AI医疗守护者

SmartEraser：中科大推出图像对象移除技术，轻松移除照片中的不想要元素，保留完美瞬间

AutoMouser：AI Chrome扩展程序，实时跟踪用户的浏览器操作，自动生成自动化操作脚本

相关课程

更多

阿里小蜜中的机器阅读技术

天池大赛平台产品使用说明

百炼实训营--进阶版

阿里云百炼，手把手教你如何构建企业大模型应用服务

基于通义灵码实现高效 AI 编码

基于Gradio的AI应用搭建实践课

相关电子书

更多

大模型服务平台百炼与通义听悟产品实操演示

无需从0开发-1天上手智能语音离在线方案

无需从0开发 1天上手只能语音离在线方案

相关实验场景

更多

【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板

如何快速体验调用通义大模型

SAE 极速部署专属 AI 证件照神器

【玩转ComfyUI】基于函数计算一键部署AI生图平台 ComfyUI

如何快速体验通义大模型

使用计算巢AI应用，快速上手实践Stable Diffusion

下一篇

阿里云开通OSS存储服务详细流程