官方博客-第8页-阿里云开发者社区

赵世振

2024-12-24

1288

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,288

阿里云大数据Al技术

2025-07-18

834

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

阿里云人工智能平台 PAI 提供了完整的模型微调产品能力，支持监督微调（SFT）、偏好对齐（DPO）、强化学习微调（GRPO) 等业界常用模型微调训练方式。根据客户需求及代码能力层级，分别提供了 PAI-Model Gallery 一键微调、PAI-DSW Notebook 编程微调、PAI-DLC 容器化任务微调的全套产品功能。

阿里云大数据Al技术

834

丕天

2025-03-21

1144

AI 推理场景的痛点和解决方案

一个典型的推理场景面临的问题可以概括为限流、负载均衡、异步化、数据管理、索引增强 5 个场景。通过云数据库 Tair 丰富的数据结构可以支撑这些场景，解决相关问题，本文我们会针对每个场景逐一说明。

丕天

1,144

ant-ray项目组

2025-04-11

1159

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,159

阿里云云原生

2025-06-03

1081

实现企业级 MCP 服务统一管理和智能检索的实践

本文将深入剖析 MCP Server 的五种主流架构模式，并结合 Nacos 服务治理框架，为企业级 MCP 部署提供实用指南。

阿里云云原生

1,081

阿里云开发者

2024-11-29

1132

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

阅读这个文章可能的收获：理解AI、看懂模型和代码、能够自己搭建模型用于实际任务。

阿里云开发者

1,132

悦达

2025-03-21

1154

监控vLLM等大模型推理性能

本文将深入探讨 AI 推理应用的可观测方案，并基于 Prometheus 规范提供一套完整的指标观测方案，帮助开发者构建稳定、高效的推理应用。

悦达

1,154

阿里云云原生

2025-08-01

1023

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

Qwen3 Coder 是全球领先的开源编程大模型，具备强大的代码生成能力与1M超长上下文支持，适用于构建复杂应用。本文通过实际案例展示其在电商网站开发中的应用，并详解提示词设计、技术拆解与部署方案，探讨Agentic AI落地的挑战与经验。

阿里云云原生

1,023

子白

2024-05-15

102457

大语言模型推理提速，TensorRT-LLM 高性能推理实践

大型语言模型（Large language models,LLM）是基于大量数据进行预训练的超大型深度学习模型，本文主要讲述TensorRT-LLM利用量化、In-Flight Batching、Attention、Graph Rewriting提升 LLM 模型推理效率。

子白

102,457

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

AI 推理场景的痛点和解决方案

AI开源框架：让分布式系统调试不再"黑盒"

实现企业级 MCP 服务统一管理和智能检索的实践

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

监控vLLM等大模型推理性能

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

大语言模型推理提速，TensorRT-LLM 高性能推理实践

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

Post-Training on PAI (4)：模型微调SFT、DPO、GRPO

AI 推理场景的痛点和解决方案

AI开源框架：让分布式系统调试不再"黑盒"

实现企业级 MCP 服务统一管理和智能检索的实践

【由浅到深】从神经网络原理、Transformer模型演进、到代码工程实现

监控vLLM等大模型推理性能

Vibecoding 新体验：实测 Qwen3 Coder 代码生成效果

大语言模型推理提速，TensorRT-LLM 高性能推理实践