官方博客-第11页-阿里云开发者社区

澄潭董艺荃

2024-05-16

88913

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

这篇文章介绍了使用开源工具NextChat和Higress搭建的一个模拟ChatGPT和通义千问对话PK的测试场景。

澄潭董艺荃

88,913

赵世振

2024-12-24

2118

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

2,118

新念

2025-02-14

2047

DeepSeek-V3 高效训练关键技术分析

本文从模型架构、并行策略、通信优化和显存优化四个方面展开，深入分析了DeepSeek-V3高效训练的关键技术，探讨其如何以仅5%的算力实现对标GPT-4o的性能。

新念

2,047

望宸

2025-02-20

1332

大模型推理服务全景图

推理性能的提升涉及底层硬件、模型层，以及其他各个软件中间件层的相互协同，因此了解大模型技术架构的全局视角，有助于我们对推理性能的优化方案进行评估和选型。

望宸

1,332

探索云世界

2024-05-15

3074

阿里云大降价后，再谈“降本增效”

2024年2月29日，阿里云宣布史上最大力度降价，引发行业对用云成本的热议。

探索云世界

3,074

ModelScope

2024-05-15

1076

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

Mistral AI在3月24日突然发布并开源了 Mistral 7B v0.2模型，有如下几个特点

ModelScope

1,076

澄潭

2025-04-03

2422

开源 Remote MCP Server 一站式托管来啦！

MCP Server 的实施存在着诸多挑战，特别是在认证授权、服务可靠性和可观测性方面，Higress 作为 AI 原生的 API 网关，提供了完整的开源 MCP Server 托管解决方案，实现存量 API 到 MCP 的协议转换。即将上线的 MCP 市场，将大幅降低开发者构建 MCP Server 的时间和人力成本。

澄潭

2,422

ModelScope

2024-05-15

1635

vLLM部署Yuan2.0：高吞吐、更便捷

vLLM是UC Berkeley开源的大语言模型高速推理框架，其内存管理核心——PagedAttention、内置的加速算法如Continues Batching等，一方面可以提升Yuan2.0模型推理部署时的内存使用效率，另一方面可以大幅提升在实时应用场景下Yuan2.0的吞吐量。

ModelScope

1,635

阿里云云原生

2024-08-12

674

5 大场景上手通义灵码企业知识库 RAG

大家好，我是通义灵码，你的智能编程助手！今天就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

674

官方博客-第11页-阿里云开发者社区

类目筛选

内容类型

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

阿里云大降价后，再谈“降本增效”

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

开源 Remote MCP Server 一站式托管来啦！

vLLM部署Yuan2.0：高吞吐、更便捷

5 大场景上手通义灵码企业知识库 RAG

官方博客-第11页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

通义千问 2.5 “客串” ChatGPT4，看这篇让你分清楚

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

DeepSeek-V3 高效训练关键技术分析

大模型推理服务全景图

阿里云大降价后，再谈“降本增效”

Mistral 7B v0.2 基础模型开源，魔搭社区微调教程和评测来啦！

开源 Remote MCP Server 一站式托管来啦！

vLLM部署Yuan2.0：高吞吐、更便捷

5 大场景上手通义灵码企业知识库 RAG