备案控制台

开发者社区大数据与机器学习人工智能平台PAI 正文

机器学习PAI中VLLM 可以支持模型长度扩展吗？

机器学习PAI中VLLM 可以支持模型长度扩展吗？如NTK-Aware Scaled RoPE

展开

收起

真的很搞笑 2024-03-11 16:27:11 233 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小周sir

面对过去，不要迷离；面对未来，不必彷徨；活在今天，你只要把自己完全展示给别人看。
机器学习PAI中的vLLM支持模型长度扩展。

vLLM（Very Large Language Models）是一个专为大语言模型高速推理设计的框架，它通过PagedAttention算法有效地管理注意力键和值，从而提高实时场景下的语言模型服务的吞吐量与内存使用效率。vLLM的核心优势在于其能够极大地提升实时语言模型服务的性能，同时减少显存的浪费。具体来说，vLLM的特点包括：
1. 张量并行支持：vLLM提供了对分布式推理的张量并行支持，这对于模型长度的扩展至关重要，因为它允许更大的模型在有限的硬件资源上运行。
2. 内存管理：通过PagedAttention算法，vLLM能够有效地管理注意力机制中的键和值，这对于处理长文本序列非常关键，因为它可以减少显存的使用，并且提高推理效率。
3. 兼容性：vLLM支持与OpenAI兼容的API接口，以及多款热门的Huggingface模型架构，这意味着用户可以在不改变模型结构的情况下，享受到vLLM带来的性能提升。
4. 易于集成：vLLM可以与HuggingFace的Transformers库无缝集成，这使得用户可以轻松地将现有的模型迁移到vLLM框架下，并利用其高性能推理能力。
5. 批处理能力：vLLM还具备对传入请求进行批处理的能力，这进一步提高了其在处理大量请求时的效率。
2024-03-12 13:47:03

赞同展开评论

问答分类：

机器学习/深度学习人工智能平台 PAI

问答标签：

人工智能平台 PAI模型机器学习人工智能平台 PAI 人工智能平台 PAI pai 人工智能平台 PAI机器学习人工智能平台 PAI扩展

问答地址：

开发者社区 > 大数据与机器学习 > 人工智能平台PAI > 问答

相关问答

人工智能平台PAI

机器学习PAI平台部署微调的大模型是怎么收费的？

143

1

0

求助，人工智能平台 PAI-DSW运行模型时，找不到 GPU

200

0

0

在魔搭社区中决定大家是否下载一个模型的因素有哪些？除模型主题之外，模型体验、模型训练等因素有影响吗？

136

0

0

机器学习PAI导出模型，如何设置导出sigmoid_cross_entropy 最优的模型？

109

1

0

想基于机器学习PAI和maxcompute,hologres 构建实时推荐模型两个产品到底什么关系？

131

1

0

机器学习PAI模型是 dssm的模型，拆塔后，只有item侧特征，这该如何构造啊？

71

1

0

阿里云机器学习团队在Transformer模型方面有什么新的进展？

70

1

0

阿里云百炼的模型微调和模型训练，是一码事么？

196

1

0

机器学习PAI怎么能加载曝光->点击训练好的embedding参数，来更新cvr模型呢？

88

1

0

联邦学习模型训练对设备资源有较高的要求吗？比如对于资源较少的设备，模型框架该如何选择呢？

174

1

0

大数据与机器学习

人工智能平台PAI

人工智能平台 PAI（Platform for AI，原机器学习平台PAI）是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、模型部署、推理优化在内的AI开发全链路服务，内置140+种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

我要提问

相关文章

基于python的出行路线规划推荐与分析系统

数字人｜数字人平台实力技术与重点推荐

不止于代码：如何写出吸引人的技术博客？

阿里云服务器ECS c9i实例收费价格：2核4G、4核8G和8核16G优惠配置整理

机器视觉软件平台哪个好：2025领衔的选型指南

热门讨论

热门文章

P人出游，你是否需要一个懂你更懂规划的AI导游呢？来搭建专属文旅问答机器人吧

PAI做了线性回归的模型，预测结果后，回归模型评估的节点，结果R2的值是负的，我理解R2的取值范围?

灵积平台上，用通义千问的开源大模型接口响应非常慢

阿里云的镜像上搜不到机器学习PAI的input用的common_io为什么？

iTAG阿里的数据标注任务怎么对接呀？

在海量用户中，将如何快速定位到目标人群进行个性化营销？

自定义机器人消息，curl: (35) TCP connection reset by peer

Intellij idea如何配置通义灵码

返回代码RISK.RISK_CONTROL_REJECTION

机器学习PAI我训练的AUC 0.7左右，这个效果是不是很差了？

展开全部

【玩转数据系列十】利用阿里云机器学习在深度学习框架下实现智能图片分类

【玩转数据系列六】文本分析算法实现新闻自动分类

【玩转数据系列一】人口普查统计案例

阿里巴巴机器学习系列课程

【教程】5分钟在PAI算法市场发布自定义算法

阿里云机器学习平台PAI，助力降低机器学习的成本和技术门槛

推荐系统之冷启动问题

PAI深度学习Tensorflow框架多机多卡多PS Server使用说明

推荐系统之业务架构总览

协同过滤做商品推荐

展开全部

还有其他疑问?