官方博客-第22页-阿里云开发者社区

阿里云云原生

2025-06-30

445

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

445

资源编排ROS

2024-05-15

485

计算巢AppFlow-如何在钉钉群实现智能答疑

随着大模型能力越来越强大，利用大语言模型进行智能答疑已经成为了一个非常普遍和常见的场景。然而，各个产品或业务方要能够准确有效地进行答疑，仅依靠大模型的通用能力是远远不够的，这时候利用私有领域FAQ文档进行大模型的检索增强生成往往可以有效解决上述问题。

资源编排ROS

485

ModelScope

2024-05-15

1898

Multi-Agent实践第7期：智能体的高效协作

教程第7期

ModelScope

1,898

寒空横槊娜米公仪等

2024-12-26

452

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

阿里云云消息队列 Kafka 版 Serverless 系列凭借其卓越的弹性能力，为道旅科技提供了灵活高效的数据流处理解决方案。无论是应对突发流量还是规划长期资源需求，该方案均能帮助企业实现资源动态调整和成本优化，同时保障业务的高可用性和连续性。

寒空横槊娜米公仪等

452

阿里云云原生

2025-01-08

367

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

对于正在使用 GitLab 国际站托管代码的企业和研发团队，除迁移至极狐 GitLab 外，国内其他主流的 DevOps 平台也具有完备的产品能力，为开发者提供了更多的选择。其中，阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案，帮助用户快速完成核心代码数据的迁移，确保代码资产安全。

阿里云云原生

367

片风

2025-01-14

539

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

政采云基础架构团队技术专家朱海峰介绍了业务网关项目的背景和解决方案。

片风

539

亦达

2025-02-20

751

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

751

望雲十雨言澈

2025-04-10

587

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

587

阿里云云原生

2025-05-14

711

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

本文探讨了如何高效、经济且可靠地将海外应用与基础设施日志统一采集至阿里云日志服务(SLS)，解决全球化业务扩展中的关键挑战。重点介绍了高性能日志采集Agent（iLogtail/LoongCollector）在海外场景的应用，推荐使用LoongCollector以获得更优的稳定性和网络容错能力。同时分析了多种网络接入方案，包括公网直连、全球加速优化、阿里云内网及专线/CEN/VPN接入等，并提供了成本优化策略和多目标发送配置指导，帮助企业构建稳定、低成本、高可用的全球日志系统。

阿里云云原生

711

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

计算巢AppFlow-如何在钉钉群实现智能答疑

Multi-Agent实践第7期：智能体的高效协作

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

计算巢AppFlow-如何在钉钉群实现智能答疑

Multi-Agent实践第7期：智能体的高效协作

道旅科技借助云消息队列 Kafka 版加速旅游大数据创新发展

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

政采云业务网关实践：使用 Higress 统一替代 APISIX/Kong/Istio Ingress

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

AI Infra之模型显存管理分析

阿里云 SLS 多云日志接入最佳实践：链路、成本与高可用性优化