官方博客-第16页-阿里云开发者社区

言澈

2025-02-28

1213

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,213

澄潭计缘望宸

2025-03-14

1017

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,017

钰诚

2024-08-12

589

使用 Higress 快速构建 AI 应用

Higress 基于企业内外的丰富场景沉淀了众多面向 AI 的功能，推出了 AI 原生的 API 网关形态并且全部开源。

钰诚

589

楠瑆

2024-12-09

557

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

阿里云 ARMS 用户体验监控（RUM）推出了针对原生鸿蒙应用的 SDK。SDK 使用 ArkTS 语言开发，支持页面采集、资源加载采集、异常采集及自定义采集等功能，能够全面监控鸿蒙应用的表现。集成简单，只需几步即可将 SDK 接入项目中，为鸿蒙应用的开发者提供了强有力的支持。

楠瑆

557

ModelScope

2025-06-16

570

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

570

ModelScope

2024-05-15

1184

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,184

元泊

2024-10-10

898

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

本文主要介绍了 ARMS 用户体验监控的基本功能特性，并介绍了在几种常见场景下的最佳实践。

元泊

898

昱临

2024-11-14

1092

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,092

易定

2024-12-06

1062

【实战干货】AI大模型工程应用于车联网场景的实战总结

本文介绍了图像生成技术在AIGC领域的发展历程、关键技术和当前趋势，以及这些技术如何应用于新能源汽车行业的车联网服务中。

易定

1,062

官方博客-第16页-阿里云开发者社区

类目筛选

内容类型

进行GPU算力管理

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

使用 Higress 快速构建 AI 应用

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

vLLM部署Yuan2.0：高吞吐、更便捷

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

【实战干货】AI大模型工程应用于车联网场景的实战总结

官方博客-第16页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

进行GPU算力管理

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

使用 Higress 快速构建 AI 应用

ARMS 用户体验监控正式发布原生鸿蒙应用 SDK

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

vLLM部署Yuan2.0：高吞吐、更便捷

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

【实战干货】AI大模型工程应用于车联网场景的实战总结

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结