官方博客-第8页-阿里云开发者社区

米基

2024-05-15

3778

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,778

赵世振

2024-09-10

3828

阿里云百炼|析言GBI产品入门指导

析言基础入门的操作体验，带领大家一起探索阿里云百炼|析言GBI的奥秘。

赵世振

3,828

舟谨

2024-11-29

2051

作为开发者，我如何提高任务型大模型应用的响应性能

本文基于实际场景，分享了作为开发者提高大模型响应性能的四个实用方法。

舟谨

2,051

赵世振

2024-12-24

1274

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

本篇文章详细讨论了如何确保大型语言模型（LLMs）输出结构化的JSON格式，这对于提高数据处理的自动化程度和系统的互操作性至关重要。

赵世振

1,274

ModelScope

2025-06-16

535

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

生成式模型在文本生成图片等领域的快速发展，为社区带来了日新月异的诸多文生图模型。

ModelScope

535

灵杰开发者

2025-07-18

919

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

淘天集团数据开发团队基于Fluss构建新一代实时数仓，解决数据消费冗余、探查困难及大State运维难题。Fluss融合列存与实时更新能力，支持列裁剪、KV点查、Delta Join及湖流一体，显著降低IO与计算资源消耗，提升作业稳定性与数据探查效率。已在淘天AB实验平台落地，覆盖搜索、推荐等核心业务，通过618大促验证，实现千万级流量、秒级延迟，资源消耗降低30%，State缩减超100TB。未来将持续深化湖仓架构，拓展AI场景应用。

灵杰开发者

919

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43715

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,715

牧申景穆

2024-09-02

3175

【算法精讲系列】阿里云百炼SFT微调实践分享

本内容为您提供了百炼平台SFT微调的实践案例，帮助您方便并快速借助模型微调定制化您自己的专属模型。

牧申景穆

3,175

刘佳旭

2023-09-26

138992

云原生场景下高可用架构的最佳实践

刘佳旭

138,992

官方博客-第8页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

阿里云百炼|析言GBI产品入门指导

作为开发者，我如何提高任务型大模型应用的响应性能

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】阿里云百炼SFT微调实践分享

云原生场景下高可用架构的最佳实践

官方博客-第8页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

阿里云百炼|析言GBI产品入门指导

作为开发者，我如何提高任务型大模型应用的响应性能

探索大型语言模型LLM推理全阶段的JSON格式输出限制方法

告别‘人海战术’！基于EvalScope 的文生图模型智能评测新方案

淘天AB实验分析平台Fluss落地实践：更适合实时OLAP的消息队列

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

【算法精讲系列】阿里云百炼SFT微调实践分享

云原生场景下高可用架构的最佳实践