官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3777

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,777

牧申景穆

2024-09-02

3175

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,175

赵世振

2024-09-10

3827

阿里云百炼|析言GBI产品入门指导

析言基础入门的操作体验，带领大家一起探索阿里云百炼|析言GBI的奥秘。

赵世振

3,827

ModelScope

2025-06-16

534

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

534

望宸

2025-02-28

1080

DeepSeek加速了模型平权，大模型推理需求激增，性能提升主战场从训练转向推理。SSE（Server-Sent Events）和WebSocket成为大模型应用的标配网络通信协议。SSE适合服务器单向推送实时数据，如一问一答场景；WebSocket支持双向实时通信，适用于在线游戏、多人协作等高实时性场景。两者相比传统HTTPS协议，能更好地支持流式输出、长时任务处理和多轮交互，满足大模型应用的需求。随着用户体量扩大，网关层面临软件变更、带宽成本及恶意攻击等挑战，需通过无损上下线、客户端重连机制、压缩算法及安全防护措施应对。

望宸

1,080

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43713

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,713

赵世振

2024-07-30

1940

阿里云百炼应用实践系列-AI助手快速搭建

本文主要介绍如何基于阿里云百炼平台快速在10分钟为您的网站添加一个 AI 助手。我们基于阿里云百炼平台的能力，以官方帮助文档为参考，搭建了一个以便全天候（7x24）回应客户咨询的AI助手，介绍了相关技术方案和主要代码，供开发者参考。

赵世振

1,940

赵世振

2024-12-24

2536

【最佳实践系列】高并发调用百炼语音合成大模型

本文介绍了阿里云百炼的CosyVoice语音合成大模型及其高并发调用优化方案。CosyVoice支持文本到语音的实时流式合成，适用于智能设备播报、音视频创作等多种场景。为了高效稳定地调用服务，文章详细讲解了WebSocket连接复用、连接池和对象池等优化技术，并通过对比实验展示了优化效果。优化后，机器负载降低，任务耗时减少，网络负载更优。同时，文章还提供了异常处理方法及常见问题解决方案，帮助开发者更好地集成和使用SDK。

赵世振

2,536

赵世振

2024-12-24

1271

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,271

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云百炼|析言GBI产品入门指导

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

大模型推理主战场：通信协议的标配

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

阿里云百炼应用实践系列-AI助手快速搭建

【最佳实践系列】高并发调用百炼语音合成大模型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

【算法精讲系列】阿里云百炼SFT微调实践分享

阿里云百炼|析言GBI产品入门指导

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

大模型推理主战场：通信协议的标配

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

阿里云百炼应用实践系列-AI助手快速搭建

【最佳实践系列】高并发调用百炼语音合成大模型

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法