官方博客-第22页-阿里云开发者社区

阿里云云原生

2025-06-30

445

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

445

瑞丹

2024-05-15

118895

DataphinV3.14全新升级：数据研发突破全域覆盖，资产治理更加灵活可控

DataphinV3.14支持传统数据库调用，带来全新高效研发体验，及时全面的数据保护、自定义监控和审批让数据治理更灵活自由。

瑞丹

118,895

ModelScope

2024-05-15

1898

【最佳实践】使用CloudLens排查iLogtail重启问题

本文主要介绍如何使用CloudLens for SLS定位和解决iLogtail日常使用中的常见问题之一：iLogtail异常重启问题。

太业

1,396

ModelScope

2024-05-15

770

联合XTuner，魔搭社区全面支持数据集的长文本训练

XTuner和魔搭社区（SWIFT）合作引入了一项长序列文本训练技术，该技术能够在多GPU环境中将长序列文本数据分割并分配给不同GPU，从而减少每个GPU上的显存占用。通过这种方式，训练超大规模模型时可以处理更长的序列，提高训练效率。魔搭社区的SWIFT框架已经集成了这一技术，支持多种大模型和数据集的训练。此外，SWIFT还提供了一个用户友好的界面，方便用户进行训练和部署，并且支持评估功能。

ModelScope

770

茏城

2024-06-28

1547

深度｜大模型时代下，基于湖仓一体的数据智能新范式

本次文根据峰会演讲内容整理：分享在大模型时代基于湖仓一体的数据产品演进，以及我们观察到的一些智能开发相关的新范式。

茏城

1,547

剑洁雲尧

2024-09-04

650

浅谈Elasticsearch的入门与实践

本文主要围绕ES核心特性：分布式存储特性和分析检索能力，介绍了概念、原理与实践案例，希望让读者快速理解ES的核心特性与应用场景。

剑洁雲尧

650

阿里云云原生

2025-01-08

367

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

对于正在使用 GitLab 国际站托管代码的企业和研发团队，除迁移至极狐 GitLab 外，国内其他主流的 DevOps 平台也具有完备的产品能力，为开发者提供了更多的选择。其中，阿里云云效也提供了针对常见代码托管平台如 GitHub、GitLab 简单便捷的迁移方案，帮助用户快速完成核心代码数据的迁移，确保代码资产安全。

阿里云云原生

367

亦达

2025-02-20

751

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

751

官方博客-第22页-阿里云开发者社区

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

DataphinV3.14全新升级：数据研发突破全域覆盖，资产治理更加灵活可控

Multi-Agent实践第7期：智能体的高效协作

【最佳实践】使用CloudLens排查iLogtail重启问题

联合XTuner，魔搭社区全面支持数据集的长文本训练

深度｜大模型时代下，基于湖仓一体的数据智能新范式

浅谈Elasticsearch的入门与实践

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

官方博客-第22页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

DataphinV3.14全新升级：数据研发突破全域覆盖，资产治理更加灵活可控

Multi-Agent实践第7期：智能体的高效协作

【最佳实践】使用CloudLens排查iLogtail重启问题

联合XTuner，魔搭社区全面支持数据集的长文本训练

深度｜大模型时代下，基于湖仓一体的数据智能新范式

浅谈Elasticsearch的入门与实践

GitLab 国际站中国大陆等地区停服，如何将数据快速迁移到云效

破解 vLLM + DeepSeek 规模化部署的“不可能三角”