官方博客-第15页-阿里云开发者社区

阿里云云原生

2025-02-25

1129

解锁 DeepSeek 安全接入、稳定运行新路径

聚焦于企业部署 DeepSeek 的应用需求，本文介绍了模型权重下载及多种部署方案，还阐述了大模型应用落地的常见需求，帮助用户逐步提升模型应用效果。

阿里云云原生

1,129

阿里云云原生

2025-05-12

1020

如何在通义灵码里使用 MCP 能力

通义灵码支持MCP工具使用，通过模型自主规划实现工具调用，深度集成魔搭MCP广场，涵盖2400+热门服务。提供STDIO和SSE两种通信模式，适用于不同场景需求。用户可通过智能体模式调用MCP工具，完成如网页内容抓取、天气查询等任务。文档详细介绍了服务配置、使用流程及常见问题解决方法，助力开发者高效拓展AI编码能力。

阿里云云原生

1,020

ModelScope

2024-05-15

1210

元象大模型开源30款量化版本加速低成本部署丨附教程

元象大模型一次性发布30款量化版本，全开源，无条件免费商用。

ModelScope

1,210

丛霄章进十眠

2024-11-06

1719

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

SAE 会继续致力于为用户提供极简易用、成本低廉、功能强大的 Serverless 应用全托管平台：“我们希望让用户做的更少而收获更多，通过 Serverless 化，深度用云就像用水电煤一样简单”。

丛霄章进十眠等

1,719

龙蜥社区OpenAnolis

2024-11-06

753

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

用好开源、做深开源、自研创新，打造全方位安全可信的服务器操作系统。

龙蜥社区OpenAnolis

753

裘展

2024-11-07

1674

白话文讲解大模型｜ Attention is all you need

本文档旨在详细阐述当前主流的大模型技术架构如Transformer架构。我们将从技术概述、架构介绍到具体模型实现等多个角度进行讲解。通过本文档，我们期望为读者提供一个全面的理解，帮助大家掌握大模型的工作原理，增强与客户沟通的技术基础。本文档适合对大模型感兴趣的人员阅读。

裘展

1,674

明巍临城水德

2024-11-14

536

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

在本文中，作者介绍了 Lingma SWE-GPT，一款专为解决复杂软件改进任务设计的开源大型语言模型系列。

明巍临城水德等

536

新念

2025-02-14

1436

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

1,436

澄潭计缘望宸

2025-03-14

990

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

通义千问最新推出的QwQ-32B推理模型，拥有320亿参数，性能媲美DeepSeek-R1（6710亿参数）。QwQ-32B支持在小型移动设备上本地运行，并可将企业大模型API调用成本降低90%以上。本文介绍了如何通过Higress AI网关实现DeepSeek-R1与QwQ-32B之间的无缝切换，涵盖环境准备、模型接入配置及客户端调用示例等内容。此外，还详细探讨了Higress AI网关的多模型服务、消费者鉴权、模型自动切换等高级功能，帮助企业解决TPS与成本平衡、内容安全合规等问题，提升大模型应用的稳定性和效率。

澄潭计缘望宸等

990

官方博客-第15页-阿里云开发者社区

类目筛选

内容类型

解锁 DeepSeek 安全接入、稳定运行新路径

如何在通义灵码里使用 MCP 能力

元象大模型开源30款量化版本加速低成本部署丨附教程

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

官方博客-第15页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

解锁 DeepSeek 安全接入、稳定运行新路径

如何在通义灵码里使用 MCP 能力

元象大模型开源30款量化版本 加速低成本部署丨附教程

Serverless 微服务治理神器： 阿里云 SAE 全链路灰度揭秘

云+AI时代下，Alibaba Cloud Linux 进一步演进思考

白话文讲解大模型｜ Attention is all you need

通义灵码 SWE-GPT：从 静态代码建模 迈向 软件开发过程长链推理

DeepSeek-V3 高效训练关键技术分析

大模型无缝切换，QwQ-32B和DeepSeek-R1 全都要

元象大模型开源30款量化版本加速低成本部署丨附教程

Serverless 微服务治理神器：阿里云 SAE 全链路灰度揭秘

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理