官方博客-第13页-阿里云开发者社区

ModelScope

2024-05-15

1181

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,181

阿里云云原生

2024-11-26

649

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

在 Apache Dubbo 3.3.0 版本之后，官方推出了全新升级的 Triple X 协议，全面支持 HTTP/1、HTTP/2 和 HTTP/3 协议。本文将围绕 Triple 协议对 HTTP/3 的支持进行详细阐述，包括其设计目标、实际应用案例、性能测试结果以及源码架构分析等内容。

阿里云云原生

649

ModelScope

2025-06-16

568

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

568

ModelScope

2024-05-15

1472

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,472

ModelScope

2024-05-15

1238

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,238

荣阳

2025-02-28

1058

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,058

阿里云云原生

2025-06-30

440

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

440

ModelScope

2024-05-15

1153

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,153

垚佳汐遥

2024-10-23

1046

通义灵码知识库问答增强：知识库构建与管理指南

通义灵码能够结合企业知识库的私域数据，生成贴合企业特点的回答。充分发挥检索增强技术的优势，构建高质量的企业知识数据以及合理的知识库权限管理是必不可少的。本文将为您详细介绍如何构造与管理一个高质量的企业知识库。

垚佳汐遥

1,046

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

元象大模型开源30款量化版本加速低成本部署丨附教程

使用A10单卡24G复现DeepSeek R1强化学习过程

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码知识库问答增强：知识库构建与管理指南

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

Apache Dubbo 正式发布 HTTP/3 版本 RPC 协议，弱网效率提升 6 倍

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

元象大模型开源30款量化版本 加速低成本部署丨附教程

使用A10单卡24G复现DeepSeek R1强化学习过程

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LISA微调技术解析：比LoRA更低的显存更快的速度

通义灵码知识库问答增强：知识库构建与管理指南

元象大模型开源30款量化版本加速低成本部署丨附教程