官方博客-第20页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

1006

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

1,006

王晨

2025-04-03

840

大模型上下文协议 MCP 带来了哪些货币化机会

本文探讨了MCP（Model-Calling Protocol）的兴起及其对AI生态的影响。自2月中旬起，MCP热度显著提升，GitHub Star和搜索指数均呈现加速增长趋势。MCP通过标准化协议连接大模型与外部工具，解决了碎片化集成问题，推动AI应用货币化及生态繁荣。文章分析了MCP与Function Calling的区别，指出MCP更适用于跨平台、标准化场景，而Function Calling在特定实时任务中仍具优势。此外，MCP促进了 supply端（如云厂商、大模型、中间件服务商）和消费端（终端用户）的变革，尤其以Devin和Manus为代表，分别改变了程序员和普通用户的交互方式。

王晨

840

ModelScope

2025-06-16

562

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

562

阿里云云原生

2025-08-18

505

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

505

泮圣伟

2024-05-15

577

MSE服务治理最佳实践：基于Ingress-nginx网关实现全链路灰度

微服务架构下，有一些需求开发涉及到微服务调用链路上的多个微服务同时改动。通常每个微服务都会有灰度环境或分组来接受灰度流量。我们希望进入上游灰度环境的流量也能进入下游灰度的环境中，确保1个请求始终在灰度环境中传递。即使这个调用链路上有一些微服务应用不存在灰度环境，那么这些微服务应用在请求下游应用的时候依然能够回到下游应用的灰度环境中。我们通过 MSE 提供的全链路灰度能力，可以在不需要修改任何业务代码的情况下，轻松实现上述所说的全链路灰度能力。

泮圣伟

577

ModelScope

2024-05-15

1148

LISA微调技术解析：比LoRA更低的显存更快的速度

LISA是Layerwise Importance Sampling for Memory-Efficient Large Language Model Fine-Tuning的简写，由UIUC联合LMFlow团队于近期提出的一项LLM微调技术，可实现把全参训练的显存使用降低到之前的三分之一左右，而使用的技术方法却是非常简单。

ModelScope

1,148

澄潭钰诚

2024-07-19

21964

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

Higress 最新的 1.4 版本基于为通义千问，以及多家云上 AGI 厂商客户提供 AI 网关的积累沉淀，开源了大量 AI 原生的网关能力。同时也在 Ingress、可观测、流控等云原生能力上做了全方位升级。

澄潭钰诚

21,964

阿里云云原生

2024-09-02

692

西游再现，一键部署 Flux 文生图大模型生成西游人物

从花果山的灵石出世，到取经路上的九九八十一难，再到大闹天宫的惊心动魄……这些耳熟能详的西游场景，如今都能通过 Flux 模型，以超乎想象的细节和真实感呈现在你眼前。本次实验在函数计算中内置的 flux.1-dev-fp8 大模型，搭配 Lora 模型，无需复杂的配置，一键部署，你就能成为这场视觉盛宴的创造者。

阿里云云原生

692

元泊

2024-10-10

890

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

本文主要介绍了 ARMS 用户体验监控的基本功能特性，并介绍了在几种常见场景下的最佳实践。

元泊

890

官方博客-第20页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

大模型上下文协议 MCP 带来了哪些货币化机会

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 EventBridge 构筑 AI 领域高效数据集成方案

MSE服务治理最佳实践：基于Ingress-nginx网关实现全链路灰度

LISA微调技术解析：比LoRA更低的显存更快的速度

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

西游再现，一键部署 Flux 文生图大模型生成西游人物

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践

官方博客-第20页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

大模型上下文协议 MCP 带来了哪些货币化机会

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

基于 EventBridge 构筑 AI 领域高效数据集成方案

MSE服务治理最佳实践：基于Ingress-nginx网关实现全链路灰度

LISA微调技术解析：比LoRA更低的显存更快的速度

Higress 重磅更新：AI 能力全面开源，云原生能力再升级

西游再现，一键部署 Flux 文生图大模型生成西游人物

Android & iOS 使用 ARMS 用户体验监控（RUM）的最佳实践