官方博客-第7页-阿里云开发者社区

牧申景穆

2024-09-02

3242

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,242

舟谨

2024-11-29

2116

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,116

望宸

2025-02-28

1129

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,129

白玙

2025-03-14

1795

详解大模型应用可观测全链路

阿里云可观测解决方案从几个方面来尝试帮助使用 QwQ、Deepseek 的 LLM 应用开发者来满足领域化的可观测述求。

白玙

1,795

阿里云云原生

2025-09-29

477

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

本文将分享我们在构建 SLS SQL Copilot 过程中的工程实践，展示如何基于阿里云 SLS 打造一套完整的 LLM 应用数据基础设施。

阿里云云原生

477

米基

2024-05-15

3839

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,839

ant-ray项目组

2025-04-11

1198

AI开源框架：让分布式系统调试不再"黑盒"

Ray是一个开源分布式计算框架，专为支持可扩展的人工智能（AI）和Python应用程序而设计。它通过提供简单直观的API简化分布式计算，使得开发者能够高效编写并行和分布式应用程序。Ray广泛应用于深度学习训练、大规模推理服务、强化学习以及AI数据处理等场景，并构建了丰富而成熟的技术生态。

ant-ray项目组

1,198

阿里云大数据Al技术

2025-07-28

1496

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Qwen3-Coder 是通义千问最新开源的 AI 编程大模型正式开源，拥有卓越的代码和 Agent 能力，在多领域取得了开源模型的 SOTA 效果。PAI 已支持最强版本 Qwen3-Coder-480B-A35B-Instruct 的云上一键部署。

阿里云大数据Al技术

1,496

扬流

2024-05-15

119145

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,145

官方博客-第7页-阿里云开发者社区

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

作为开发者，我如何提高任务型大模型应用的响应性能

大模型推理主战场：通信协议的标配

详解大模型应用可观测全链路

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

大模型推理优化实践：KV cache复用与投机采样

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Paimon 与 Spark 的集成（二）：查询优化

官方博客-第7页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

【算法精讲系列】阿里云百炼SFT微调实践分享

作为开发者，我如何提高任务型大模型应用的响应性能

大模型推理主战场：通信协议的标配

详解大模型应用可观测全链路

SLS Copilot 实践：基于 SLS 灵活构建 LLM 应用的数据基础设施

大模型推理优化实践：KV cache复用与投机采样

AI开源框架：让分布式系统调试不再"黑盒"

【新模型速递】PAI-Model Gallery云上一键部署Qwen3-Coder模型

Paimon 与 Spark 的集成（二）：查询优化