备案控制台

开发者社区 > ModelScope模型即服务 > 正文

语言模型多轮对话有什么可以降低内存占用的方法吗？多进行几轮对话内存就不够用了

torch.cuda.OutOfMemoryError: CUDA out of memory. Tried to allocate 1.16 GiB (GPU 0; 7.92 GiB total capacity; 5.10 GiB already allocated; 602.31 MiB free; 6.23 GiB reserved in total by PyTorch) If reserved memory is >> allocated memory try setting max_split_size_mb to avoid fragmentation. See documentation for Memory Management and PYTORCH_CUDA_ALLOC_CONF

展开

收起

游客3ocfkzkv4d4jq 2024-05-14 14:54:02 15 0

0 条回答

写回答

取消提交回答

相关问答

PolarDB主备切换为什么会降低内存

11

1

0

Flink作业所需要的CPU及内存的计算方法

10

1

0

NI内存泄漏排查的常见方法有哪些？

15

1

0

Redis内存忽然降低

20

1

0

main方法中的字节码执行到detail.Sum方法前的JVM内存结构是什么样子的？

20

1

0

Project Lilliput是如何降低内存占用的？

16

1

0

Hologres有没有不升级就能区分内存的方法呢？

31

0

0

Flink使用fastjson 字符串转json 方法内存满了，有什么更好的方法处理吗？

74

3

0

modelscope-funasr增加语言模型内存变大了，怎么压缩语言模型？

20

1

0

Flink CDC 里有没什么方法去预估给多少内存的？

20

0

0

ModelScope模型即服务

ModelScope旨在打造下一代开源的模型即服务共享平台，为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品，让模型应用更简单！欢迎加入技术交流群：微信公众号：魔搭ModelScope社区，钉钉群号：44837352

我要提问

热门讨论

热门文章

ModelScope中，模型下载默认路径在哪个路径？

ModelScope qwen7b、14b、72b lora微调分别需要的显存和cpu内存是多少？

com/action/joingroup?code=v1是什么意思

无法导入 modelscope，已经pip install了

请问ModelScope中，怎么修改本地运行，模型自动下载到 c 盘下？

我希望通过damo-YOLO训练1500*1500的图片

Modelscope魔塔的创空间的文件怎么下载到本地呀？

ModelScope 使用14B模型推理时报这个错误？

加载ModelScope模型以后，为什么调用，model.chat()会提示错误？

最近大模型降价潮，哪家才是真的“价美”也“物美”？

展开全部

通义千问7B-基于本地知识库问答

（建议收藏深读）GPT 高阶玩法 - 万字 GPT 模型自动化应用指南（ javaScript 示例）（上）

社区供稿 | 本地部署通义千问大模型做RAG验证

Llama 3开源！魔搭社区手把手带你推理，部署，微调和评估

阿里云通义千问向全社会开放！

使用PostMan请求阿里云通义千问大模型

Phi-3：小模型，大未来！（附魔搭社区推理、微调实战教程）

multi-agent：多角色Agent协同合作，高效完成复杂任务

LLM大模型实战 —— DB-GPT阿里云部署指南

vanna+qwen实现私有模型的SQL转换

展开全部

相关电子书

更多

内存取证与IaaS云平台恶意行为的安全监控 立即下载

云服务器ECS内存增强型实例re6全新发布 立即下载

低代码开发师（初级）实战教程 立即下载