官方博客-第6页-阿里云开发者社区

阿里云大数据Al技术

2025-07-28

1435

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,435

扬流

2024-05-15

119089

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,089

舟谨

2024-11-29

2054

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,054

阿里云云原生

2025-08-18

478

基于 EventBridge 构筑 AI 领域高效数据集成方案

本文深入探讨了AI时代数据处理的变革与挑战，分析了事件驱动架构（EventBridge）在AI数据处理中的技术优势，并结合实践案例，展示了其在多源数据接入、向量数据库优化、智能数据转换等方面的应用价值。

阿里云云原生

478

牧申景穆

2024-09-02

3177

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,177

赵世振

2024-09-10

3829

阿里云百炼|析言GBI产品入门指导

析言基础入门的操作体验，带领大家一起探索阿里云百炼|析言GBI的奥秘。

赵世振

3,829

米基

2024-05-15

3778

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,778

赵世振

2024-12-24

2539

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,539

赵世振

2024-12-24

1274

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,274

官方博客-第6页-阿里云开发者社区

类目筛选

内容类型

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Paimon 与 Spark 的集成（二）：查询优化

作为开发者，我如何提高任务型大模型应用的响应性能

基于 EventBridge 构筑 AI 领域高效数据集成方案

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云百炼|析言GBI产品入门指导

大模型推理优化实践：KV cache复用与投机采样

【最佳实践系列】高并发调用百炼语音合成大模型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

官方博客-第6页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Paimon 与 Spark 的集成（二）：查询优化

作为开发者，我如何提高任务型大模型应用的响应性能

基于 EventBridge 构筑 AI 领域高效数据集成方案

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云百炼|析言GBI产品入门指导

大模型推理优化实践：KV cache复用与投机采样

【最佳实践系列】高并发调用百炼语音合成大模型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法