官方博客-第24页-阿里云开发者社区

亦达

2025-02-20

714

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

714

封崇

2025-04-16

1423

MCP 正当时：FunctionAI MCP 开发平台来了！

MCP 的价值是统一了 Agent 和 LLM 之间的标准化接口，有了 MCP Server 的托管以及开发态能力只是第一步，接下来重要的是做好 MCP 和 Agent 的集成，FunctionAI 即将上线 Agent 开发能力，敬请期待。

封崇

1,423

阿里云云原生

2025-08-07

358

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

在 AI 与云原生融合的趋势下，开发者面临模型协同与云端扩展的挑战。MCP（模型上下文协议）提供统一的交互规范，简化模型集成与服务开发。Function AI 支持 MCP 代码一键上云，提供绑定代码仓库、OSS 上传、本地交付物部署及镜像部署等多种构建方式，助力开发者高效部署智能服务，实现快速迭代与云端协同。

阿里云云原生

358

阿里云实时数仓Hologres

2024-05-15

109900

基于 Hologres+Flink 的曹操出行实时数仓建设

本文主要介绍曹操出行实时计算负责人林震，基于 Hologres+Flink 的曹操出行实时数仓建设的解决方案分享。

阿里云实时数仓Hologres

109,900

阿里云实时数仓Hologres

2024-06-18

2314

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

2,314

牛俊

2024-08-15

11754

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,754

才胜南也

2024-09-05

980

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

980

阿里云云原生

2024-10-18

980

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

得益于阿里云函数计算的产品能力，魔搭 SwingDeploy 后的模型推理 API 服务默认具备极致弹性伸缩（缩零能力）、GPU 虚拟化（最小 1GB 显存粒度）、异步调用能力、按用付费、闲置计费等能力，这些能力帮助算法工程师大大加快了魔搭开源模型投入生产的生命周期。

阿里云云原生

980

寒空横槊娜米公仪等

2024-12-26

429

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

阿里云云消息队列 Kafka 版 Serverless 系列凭借其卓越的弹性能力，为道旅科技提供了灵活高效的数据流处理解决方案。无论是应对突发流量还是规划长期资源需求，该方案均能帮助企业实现资源动态调整和成本优化，同时保障业务的高可用性和连续性。

寒空横槊娜米公仪等

429

官方博客-第24页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP 正当时：FunctionAI MCP 开发平台来了！

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

基于 Hologres+Flink 的曹操出行实时数仓建设

森马基于MaxCompute+Hologres+DataWorks构建数据中台

动手实践：高效构建企业级AI搜索

RAG效果优化：高质量文档解析详解

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

官方博客-第24页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP 正当时：FunctionAI MCP 开发平台来了！

Function AI 助力用户自主开发 MCP 服务，一键上云高效部署

基于 Hologres+Flink 的曹操出行实时数仓建设

森马基于MaxCompute+Hologres+DataWorks构建数据中台

动手实践：高效构建企业级AI搜索

RAG效果优化：高质量文档解析详解

海量大模型如何一键部署上云，函数计算 x ModelScope 社区给出答案

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展