官方博客-第16页-阿里云开发者社区

亦达

2025-02-20

699

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

699

阿里云云原生

2025-05-23

541

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

本文将以 MCP Server 在函数计算平台的深度集成为研究载体，解构基于 SSE 长连接通信模型，剖析会话亲和、优雅升级等关键技术，揭示 Serverless 架构在 MCP 场景中的亲和性创新实践。

阿里云云原生

541

行疾

2024-05-15

3217

阿里云容器服务 ACK AI 助手正式上线

期待已久！阿里云容器服务 ACK AI 助手正式上线

行疾

3,217

吴昆

2024-05-15

222067

Kube Queue：Kubernetes 任务排队的利器

吴昆

222,067

阿里云实时数仓Hologres

2024-05-15

1000

Flink+Paimon+Hologres 构建实时湖仓数据分析

本文整理自阿里云高级专家喻良，在 Flink Forward Asia 2023 主会场的分享。

阿里云实时数仓Hologres

1,000

牛俊

2024-08-15

11739

动手实践：高效构建企业级AI搜索

本文介绍了基于阿里云 Elasticsearch的AI搜索产品能力、业务价值、场景应用，以及搭建演示等。

牛俊

11,739

赵世振

2024-08-22

1222

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,222

寒斜

2024-11-19

733

基于事件驱动构建 AI 原生应用

AI 应用在商业化服务的阶段会面临诸多挑战，比如更快的服务交付速度，更实时、精准的结果以及更人性化的体验等，传统架构限制于同步交互，无法满足上述需求，本篇文章给大家分享一下如何基于事件驱动架构应对上述挑战。

寒斜

733

阿里云云原生

2025-04-28

699

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

本文介绍了阿里云容器服务（ACK）支持的StrmVol存储卷方案，旨在解决Kubernetes环境中海量小文件访问性能瓶颈问题。通过虚拟块设备与内核态文件系统（如EROFS）结合，StrmVol显著降低了小文件访问延迟，适用于AI训练集加载、时序日志分析等场景。其核心优化包括内存预取加速、减少I/O等待、内核态直接读取避免用户态切换开销，以及轻量索引快速初始化。示例中展示了基于Argo Workflows的工作流任务，模拟分布式图像数据集加载，测试结果显示平均处理时间为21秒。StrmVol适合只读场景且OSS端数据无需频繁更新的情况，详细使用方法可参考官方文档。

阿里云云原生

699

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

阿里云容器服务 ACK AI 助手正式上线

Kube Queue：Kubernetes 任务排队的利器

Flink+Paimon+Hologres 构建实时湖仓数据分析

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

基于事件驱动构建 AI 原生应用

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

MCP Server 实践之旅第 3 站：MCP 协议亲和性的技术解析

阿里云容器服务 ACK AI 助手正式上线

Kube Queue：Kubernetes 任务排队的利器

Flink+Paimon+Hologres 构建实时湖仓数据分析

动手实践：高效构建企业级AI搜索

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

基于事件驱动构建 AI 原生应用

StrmVol 存储卷：解锁 K8s 对象存储海量小文件访问性能新高度