官方博客-第13页-阿里云开发者社区

言澈

2025-02-28

1213

进行GPU算力管理

本篇主要简单介绍了在AI时代由‘大参数、大数据、大算力’需求下，对GPU算力管理和分配带来的挑战。以及面对这些挑战，GPU算力需要从单卡算力管理、单机多卡算力管理、多机多卡算力管理等多个方面发展出来的业界通用的技术。

言澈

1,213

澄潭计缘望宸

2025-03-14

1017

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,017

探索云世界

2024-05-15

2910

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

2,910

赵世振

2024-08-22

1257

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

在阿里云平台上，您只需十分钟，无需任何编码，即可在企业微信上为您的组织集成一个具备大模型能力的AI助手。此助手可24小时响应用户咨询，解答各类问题，尤其擅长处理私域问题，从而成为您企业的专属助手，有效提升用户体验及业务竞争力。

赵世振

1,257

阿里云云原生

2025-04-07

710

极氪汽车云原生架构落地实践

随着极氪数字业务的飞速发展，背后的 IT 技术也在不断更新迭代。极氪极为重视客户对服务的体验，并将系统稳定性、业务功能的迭代效率、问题的快速定位和解决视为构建核心竞争力的基石。

阿里云云原生

710

ModelScope

2025-06-16

570

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

570

阿里云网络

2023-07-12

927

阿里云飞天洛神云网络集中式网关ACMG最佳实践

云网络集中式网关ACMG的实践

阿里云网络

927

ModelScope

2024-05-15

1184

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,184

昱临

2024-11-14

1092

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

笔者结合实践经验以近期在负责的复杂表格智能问答为切入点，结合大模型的哲学三问（“是谁、从哪里来、到哪里去”），穿插阐述自己对大模型的一些理解与判断，以及面向公共云LLM的建设模式思考，并分享软件设计+模型算法结合的一些研发实践经验。

昱临

1,092

官方博客-第13页-阿里云开发者社区

类目筛选

内容类型

进行GPU算力管理

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

阿里云大降价后，再谈“降本增效”

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

极氪汽车云原生架构落地实践

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

阿里云飞天洛神云网络集中式网关ACMG最佳实践

vLLM部署Yuan2.0：高吞吐、更便捷

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结

官方博客-第13页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

进行GPU算力管理

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

阿里云大降价后，再谈“降本增效”

阿里云百炼应用实践系列-10分钟在企业微信中集成一个 AI 助手

极氪汽车云原生架构落地实践

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

阿里云飞天洛神云网络集中式网关ACMG最佳实践

vLLM部署Yuan2.0：高吞吐、更便捷

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性 思考到实践经验总结

万字干货｜复杂表格多Agent方案：从LLM洞察、系统性思考到实践经验总结