官方博客-第14页-阿里云开发者社区

ModelScope

2024-05-15

1182

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,182

龙蜥社区OpenAnolis

2024-11-06

775

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

775

荣阳

2025-02-28

1060

使用A10单卡24G复现DeepSeek R1强化学习过程

本文描述DeepSeek的三个模型的学习过程，其中DeepSeek-R1-Zero模型所涉及的强化学习算法，是DeepSeek最核心的部分之一会重点展示。

荣阳

1,060

望雲十雨言澈

2025-04-10

583

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

583

阿里云云原生

2025-04-17

1277

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

通义灵码新上的外挂 Project Rules 获得了开发者的一致好评：最小成本适配我的开发风格、相当把团队经验沉淀下来，是个很好功能……

阿里云云原生

1,277

阿里云云原生

2025-06-30

442

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

442

致问

2023-09-15

120044

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

本文将会分享Hologres RoaringBitmap 方案在画像分析的应用实践，实现更快更准的画像分析。

致问

120,044

ModelScope

2024-05-15

1473

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

零一万物发布并开源了Yi系列中的“理科状元”——Yi-9B，可在魔搭体验

ModelScope

1,473

云服务器ECS

2024-05-15

436

百亿大规模图在广告场景的应用

这篇摘要主要介绍了美团外卖在搜索推荐业务中如何利用图技术解决挑战，包括外卖广告搜索推荐业务的介绍、异构大图的演进、大规模图引擎的建设，以及系统的总结和展望。

云服务器ECS

436

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

百亿大规模图在广告场景的应用

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

使用A10单卡24G复现DeepSeek R1强化学习过程

AI Infra之模型显存管理分析

通义灵码 Rules 库合集来了，覆盖Java、TypeScript、Python、Go、JavaScript 等

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

Hologres RoaringBitmap实践，千亿级画像数据秒级分析

零一万物开源Yi系列“理科状元”Yi-9B，消费级显卡可跑，魔搭社区最佳实践

百亿大规模图在广告场景的应用