官方博客-第18页-阿里云开发者社区

亦达

2025-02-20

714

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

714

阿里云开发者

2025-03-21

803

在IDEA中借助满血版 DeepSeek 提高编码效率

通义灵码2.0引入了DeepSeek V3与R1模型，新增Qwen2.5-Max和QWQ模型，支持个性化服务切换。阿里云发布开源推理模型QwQ-32B，在数学、代码及通用能力上表现卓越，性能媲美DeepSeek-R1，且部署成本低。AI程序员功能涵盖表结构设计、前后端代码生成、单元测试与错误排查，大幅提升开发效率。跨语言编程示例中，成功集成DeepSeek-R1生成公告内容。相比1.0版本，2.0支持多款模型，丰富上下文类型，具备多文件修改能力。总结显示，AI程序员生成代码准确度高，但需参考现有工程风格以确保一致性，错误排查功能强大，适合明确问题描述场景。相关链接提供下载与原文参考。

阿里云开发者

803

阿里云云原生

2025-06-30

425

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

425

王明橙鲤黄俊

2024-05-15

64124

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,124

子白

2024-05-15

102444

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,444

杨永

2024-05-15

93871

使用KMS为MSE-Nacos敏感配置加密的最佳实践

本文主要介绍通过KMS密钥管理服务产生的密钥对敏感的AK等数据进行加密之后可以有效解决泄漏带来的安全风险问题，其次通过KMS凭据托管的能力直接将MSE的主AK进行有效管理，保障全链路无AK的业务体验，真正做到安全、可控。

杨永

93,871

ModelScope

2024-05-15

943

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

基于单个开源小模型的工具调用Agent，由于模型容量和预训练能力获取的限制，无法在推理和规划、工具调用、回复生成等任务上同时获得比肩大模型等性能。

ModelScope

943

隆基

2024-05-15

108469

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

从整体技术架构上学习 RocketMQ 5.0 的云原生架构、一体化架构，最后再分别从业务场景切入，详细介绍 RocketMQ 5.0 在不同的业务场景提供的能力和关键技术原理，包括业务消息、流处理、物联网以及面向云时代的事件驱动场景。

隆基

108,469

阿里云云原生

2024-05-15

153777

Higress 基于自定义插件访问 Redis

本文介绍了Higress，一个支持基于WebAssembly (WASM) 的边缘计算网关，它允许用户使用Go、C++或Rust编写插件来扩展其功能。文章特别讨论了如何利用Redis插件实现限流、缓存和会话管理等高级功能。

阿里云云原生

153,777

官方博客-第18页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDEA中借助满血版 DeepSeek 提高编码效率

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

通义千问开源模型在PAI灵骏的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 基于自定义插件访问 Redis

官方博客-第18页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

在IDEA中借助满血版 DeepSeek 提高编码效率

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

通义千问开源模型在PAI灵骏的最佳实践

大语言模型推理提速，TensorRT-LLM 高性能推理实践

使用KMS为MSE-Nacos敏感配置加密的最佳实践

Modelscope结合α-UMi：基于Modelscope的多模型协作Agent

深度剖析 RocketMQ 5.0，Apache RocketMQ：如何从互联网时代演进到云时代？

Higress 基于自定义插件访问 Redis