官方博客-第24页-阿里云开发者社区

亦达

2025-02-20

710

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

710

阿里云云原生

2025-02-25

1117

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,117

封崇

2025-04-16

1421

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,421

王明橙鲤黄俊

2024-05-15

64118

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

64,118

百宝

2024-05-15

730

ECS多场景迁移上云最佳实践

阿里云弹性计算团队十三位产品专家和技术专家共同分享云上运维深度实践，详细阐述如何利用CloudOps工具实现运维提效、弹性降本。

百宝

730

ModelScope

2024-05-15

2579

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

2,579

ModelScope

2024-05-15

1847

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,847

阿里云实时数仓Hologres

2024-05-15

75055

大数据分析平台之 OLAP 架构的最佳实践

本文将分享聚水潭云原生 OLAP 架构的最佳实践。

阿里云实时数仓Hologres

75,055

百潼

2024-08-12

8144

敦煌智旅：Serverless 初探，运维提效 60%

SAE 提供了一个开箱即用的 Serverless PaaS 平台，提供了微服务、监控等能力，帮助敦煌智旅很好地解决了发版困难、运维困难、弹性能力不足和资源利用率低等痛点问题。成功实现轻松应对 10 倍突增流量洪峰，运维效率大幅提升。

百潼

8,144

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

MCP 正当时：FunctionAI MCP 开发平台来了！

通义千问开源模型在PAI灵骏的最佳实践

ECS多场景迁移上云最佳实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

大数据分析平台之 OLAP 架构的最佳实践

敦煌智旅：Serverless 初探，运维提效 60%

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

解锁 DeepSeek 安全接入、稳定运行新路径

MCP 正当时：FunctionAI MCP 开发平台来了！

通义千问开源模型在PAI灵骏的最佳实践

ECS多场景迁移上云最佳实践

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

Multi-Agent实践第7期：智能体的高效协作

大数据分析平台之 OLAP 架构的最佳实践

敦煌智旅：Serverless 初探，运维提效 60%