米基

2024-05-15

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

765

ModelScope

2024-05-15

1161

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,161

阿里云实时数仓Hologres

2024-06-18

973

森马基于MaxCompute+Hologres+DataWorks构建数据中台

本次案例主要分享森马集团面对多年自建的多套数仓产品体系，通过阿里云MaxCompute+Hologres+DataWorks统一数仓平台，保障数据生产稳定性与数据质量，减少ETL链路及计算时间，每年数仓整体费用从300多万降到180万。

阿里云实时数仓Hologres

973

阿里云百炼

2024-07-03

373

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

373

阿里云百炼

2024-07-09

478

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

本文以百炼官方文档问答助手为例，介绍如何基于百炼平台打造基于LlamaIndex的RAG文档问答产品。我们基于百炼平台的底座能力，以官方帮助文档为指定知识库，搭建了问答服务，支持钉钉、Web访问。介绍了相关技术方案和主要代码，供开发者参考。

阿里云百炼

478

阿里云云原生

2024-07-30

175

5 大场景上手通义灵码企业知识库 RAG

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

175

悟鸣

2024-05-15

238441

一文掌握大模型提示词技巧：从战略到战术

本文将用通俗易懂的语言，带你从战略（宏观）和战术（微观）两个层次掌握大模型提示词的常见技巧，真正做到理论和实践相结合，占领 AI 运用的先机。

悟鸣

238,441

阿里云实时数仓Hologres

2024-07-23

24203

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云实时数仓Hologres

24,203

骐迹

2024-05-15

472

阿里云SDWAN解决方案部署指南

利用阿里云丰富云网络产品，提供完整的SDWAN企业分支互联/企业上云解决方案。本次SDWAN解决方案部署指导场景以解决企业大陆分支机构、亚太IDC及云上VPC构建企业办公组网为例。意在指导客户在项目部署实施阶段可参考本文自助完成业务上线的搭建。本文内容已经对外披露。

骐迹

472

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

在魔搭使用ComfyUI，玩转AIGC

森马基于MaxCompute+Hologres+DataWorks构建数据中台

阿里云百炼模型入门篇-大语言模型

阿里云百炼应用实践系列-基于LlamaIndex的文档问答助手

5 大场景上手通义灵码企业知识库 RAG

一文掌握大模型提示词技巧：从战略到战术

分析性能提升40%，阿里云Hologres流量场景最佳实践

阿里云SDWAN解决方案部署指南