官方博客-第20页-阿里云开发者社区

ModelScope

2024-05-15

1185

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,185

望宸

2025-02-20

686

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

686

亦达

2025-02-20

750

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

vLLM 是一种便捷的大型语言模型（LLM）推理服务，旨在简化个人和企业用户对复杂模型的使用。通过 vLLM，用户可以轻松发起推理请求，享受高效、稳定的 LLM 服务。针对大规模部署 vLLM 的挑战，如大模型参数量、高效推理能力和上下文理解等，阿里云函数计算（FC）提供了 GPU 预留实例闲置计费功能，优化了性能、成本和稳定性之间的平衡。此外，FC 支持简便的部署流程和多种应用集成方式，帮助企业快速上线并管理 vLLM 服务。总结来说，vLLM 结合 FC 的解决方案为企业提供了强大的技术支持和灵活的部署选项，满足不同业务需求。

亦达

750

阿里云云原生

2025-05-12

1045

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,045

ModelScope

2025-06-16

570

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

570

冷林

339

大模型终于能“听懂”云操作了？

本文通过 MCP Server 和大模型的结合，实现云产品管理的自然语言操作，极大提升开发者的操作效率和用户体验。

冷林

339

阿里云云原生

2025-06-30

444

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

本文介绍了如何使用 llmaz 快速部署基于 vLLM 的大语言模型推理服务，并结合 Higress AI 网关实现流量控制、可观测性、故障转移等能力，构建稳定、高可用的大模型服务平台。

阿里云云原生

444

阿里云云原生

408

LoongCollector：构建智能时代的数据采集新范式

本文聚焦 LoongSuite 生态核心组件 LoongCollector，深度解析 LoongCollector 在智算服务中的技术突破，涵盖多租户观测隔离、GPU 集群性能追踪及事件驱动型数据管道设计，通过零侵入采集、智能预处理与自适应扩缩容机制，构建面向云原生 AI 场景的全栈可观测性基础设施，重新定义高并发、强异构环境下的可观测性能力边界。

阿里云云原生

408

阿里云云原生

2025-08-18

518

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

518

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何在通义灵码里使用 MCP 能力

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

大模型终于能“听懂”云操作了？

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LoongCollector：构建智能时代的数据采集新范式

基于 EventBridge 构筑 AI 领域高效数据集成方案

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

vLLM部署Yuan2.0：高吞吐、更便捷

大模型推理服务全景图

破解 vLLM + DeepSeek 规模化部署的“不可能三角”

如何在通义灵码里使用 MCP 能力

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

大模型终于能“听懂”云操作了？

基于 AI 网关和 llmaz，提升 vLLM 推理服务可用性和部署易用性的实践

LoongCollector：构建智能时代的数据采集新范式

基于 EventBridge 构筑 AI 领域高效数据集成方案