官方博客-第14页-阿里云开发者社区

澄潭计缘望宸

2025-03-14

997

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

997

望雲十雨言澈

2025-04-10

568

AI Infra之模型显存管理分析

本文围绕某线上客户部署DeepSeek-R1满血版模型时进行多次压测后，发现显存占用一直上升，从未下降的现象，记录了排查过程。

望雲十雨言澈等

568

阿里云云原生

2025-05-12

1026

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,026

黛忻赵世振

2024-09-23

932

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

小熊油耗在进行架构升级时，进行了广泛的市场调研，深入分析了国内多家云服务商。经过对比多种 IaaS 层云主机方案及 Serverless 产品的部署策略，他们最终选择了阿里云Serverless 应用引擎 SAE。小熊油耗认为，阿里云能给他们提供更强的安全感，安全感来自于阿里云是一个更大的平台：历史最悠久，用户最多、产品最丰富、配套工具众多、技术支持体系成熟，阿里云 SAE，不仅在稳定性上表现卓越，在细粒度的成本控制和极致的弹性能力上表现也非常出色，而且免运维，完美契合了小熊油耗作为一家细分领域小而美的公司的需求。

黛忻赵世振

932

太业

2024-09-27

847

跟着iLogtail学习容器运行时与K8s下日志采集方案

iLogtail 作为开源可观测数据采集器，对 Kubernetes 环境下日志采集有着非常好的支持，本文跟随 iLogtail 的脚步，了解容器运行时与 K8s 下日志数据采集原理。

太业

847

裘展

2024-11-07

1681

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,681

新念

2025-02-14

1444

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,444

ModelScope

2024-05-15

1957

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,957

羽沐

2024-12-13

1994

动态链接的魔法：Linux下动态链接库机制探讨

本文将深入探讨Linux系统中的动态链接库机制，这其中包括但不限于全局符号介入、延迟绑定以及地址无关代码等内容。

羽沐

1,994

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

如何在通义灵码里使用 MCP 能力

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

跟着iLogtail学习容器运行时与K8s下日志采集方案

白话文讲解大模型｜ Attention is all you need

DeepSeek-V3 高效训练关键技术分析

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

动态链接的魔法：Linux下动态链接库机制探讨

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

AI Infra之模型显存管理分析

如何在通义灵码里使用 MCP 能力

降本 60%！小熊油耗使用阿里云 SAE 更加稳定可靠

跟着iLogtail学习容器运行时与K8s下日志采集方案

白话文讲解大模型｜ Attention is all you need

DeepSeek-V3 高效训练关键技术分析

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

动态链接的魔法：Linux下动态链接库机制探讨