人工智能平台PAI产品使用合集之vLLM是否支持模型长度扩展-阿里云开发者社区

人工智能平台PAI产品使用合集之vLLM是否支持模型长度扩展

2024-06-30 173

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

本文涉及的产品

交互式建模 PAI-DSW，每月250计算时 3个月

模型训练 PAI-DLC，100CU*H 3个月

模型在线服务 PAI-EAS，A10/V100等 500元 1个月

简介： 阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台，旨在降低AI开发门槛，加速创新，助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务，共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述，涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。

问题一：机器学习PAI Pyalink1.6.2总是出题安装，对安装环境有什么要求？

机器学习PAI Pyalink1.6.2总是出题安装，对安装环境有什么要求？Python3.8.5

参考答案：

可以试试这个源 https://pypi.tuna.tsinghua.edu.cn/simple

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/602850

问题二：机器学习PAI alink执行批任务，内存不回收。直到taskmanager挂掉怎么办？

机器学习PAI alink执行批任务，执行一次内存占用就升高一些，且不回收。直到taskmanager挂掉怎么办？这个问题发生在从 ClickHouse 读取批数据并经过 ecod处理后写入 Kafka 的过程中。

参考答案：

环境里查一下看看，逻辑上应该是没有内存泄漏，算法很简单

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/602846

问题三：机器学习PAI代码每次输出的结果都不一样，有没有类似随机种子的方法可以固定输出？

机器学习PAI代码每次输出的结果都不一样，有没有类似随机种子的方法可以固定输出？

参考答案：

这个没有。训练有随机性，预测应该是没有的。可以将训练的结果保存，预测load模型。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/602842

问题四：机器学习PAI中VLLM 可以支持模型长度扩展吗？

机器学习PAI中VLLM 可以支持模型长度扩展吗？如NTK-Aware Scaled RoPE

飞天免费试用计划

领取免费云资源，开启云上实践第一步

参考答案：

机器学习PAI中的vLLM支持模型长度扩展。

vLLM（Very Large Language Models）是一个专为大语言模型高速推理设计的框架，它通过PagedAttention算法有效地管理注意力键和值，从而提高实时场景下的语言模型服务的吞吐量与内存使用效率。vLLM的核心优势在于其能够极大地提升实时语言模型服务的性能，同时减少显存的浪费。具体来说，vLLM的特点包括：

张量并行支持：vLLM提供了对分布式推理的张量并行支持，这对于模型长度的扩展至关重要，因为它允许更大的模型在有限的硬件资源上运行。
内存管理：通过PagedAttention算法，vLLM能够有效地管理注意力机制中的键和值，这对于处理长文本序列非常关键，因为它可以减少显存的使用，并且提高推理效率。
兼容性：vLLM支持与OpenAI兼容的API接口，以及多款热门的Huggingface模型架构，这意味着用户可以在不改变模型结构的情况下，享受到vLLM带来的性能提升。
易于集成：vLLM可以与HuggingFace的Transformers库无缝集成，这使得用户可以轻松地将现有的模型迁移到vLLM框架下，并利用其高性能推理能力。
批处理能力：vLLM还具备对传入请求进行批处理的能力，这进一步提高了其在处理大量请求时的效率。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/602741

问题五：机器学习PAI我想问一下，你们预期的qwen-7B模型，部署eas上加速推理后，RT最好能达到多少？

机器学习PAI中vllm换成默认版本0.3.0，加上两条参数后可以正常调通了。

我想问一下，你们预期的qwen-7B模型，部署eas上加速推理后，RT最好能达到多少？

参考答案：

vllm主要的优势还是吞吐，而且卡型不同请求内容不同，RT时间也不太一样，可以参考下官方给的数据。

关于本问题的更多回答可点击进行查看：

https://developer.aliyun.com/ask/602740

人工智能平台PAI产品使用合集之vLLM是否支持模型长度扩展

问题一：机器学习PAI Pyalink1.6.2总是出题安装，对安装环境有什么要求？

问题二：机器学习PAI alink执行批任务，内存不回收。直到taskmanager挂掉怎么办？

问题三：机器学习PAI代码每次输出的结果都不一样，有没有类似随机种子的方法可以固定输出？

问题四：机器学习PAI中VLLM 可以支持模型长度扩展吗？

问题五：机器学习PAI我想问一下，你们预期的qwen-7B模型，部署eas上加速推理后，RT最好能达到多少？

人工智能平台PAI

热门文章

最新文章

相关产品

相关课程

相关电子书

相关实验场景