官方博客-第14页-阿里云开发者社区

米基

2024-05-15

3860

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

3,860

探索云世界

2024-05-15

1627

一文理解淘宝购物车背后的逻辑

提升用户的使用体验才是产品升级的核心，本文将从业务发展以及技术沉淀两个方面来总结淘宝购物车的产品升级之路。

探索云世界

1,627

才胜南也

2024-09-05

1014

RAG效果优化：高质量文档解析详解

本文关于如何将非结构化数据（如PDF和Word文档）转换为结构化数据，以便于RAG（Retrieval-Augmented Generation）系统使用。

才胜南也

1,014

施晨尹丰彬筱文李林杨黄俊等

2023-11-07

43776

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

基于原始的阿里云计算平台产技文档，搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地，将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%，答疑采纳率70+%，显著提升答疑效率。

施晨尹丰彬筱文李林杨黄俊等

43,776

阿里云存储

2024-07-16

20504

几百T的视频、图片数据进行更有效地存储和管理

采用传统硬盘搭建存储方案，看起来成本低廉，但是再加上各种附加因素后却大幅攀升，而云存储厂商通常提供基于订阅的定价模型、一些免费服务和一定的折扣。现在，我们就来了解一下如何更省钱地使用云存储。

阿里云存储

20,504

扬流

2024-05-15

119165

Paimon 与 Spark 的集成（二）：查询优化

通过一系列优化，我们将 Paimon x Spark 在 TpcDS 上的性能提高了37+%，已基本和 Parquet x Spark 持平，本文对其中的关键优化点进行了详细介绍。

扬流

119,165

豁朗

2024-05-15

410

使用Logtail采集MQTT协议数据

本文主要介绍如何使用Logtail来采集MQTT协议的数据。

豁朗

410

阿里云实时数仓Hologres

2024-06-27

103038

Hologres+Flink企业级实时数仓核心能力介绍

通过Hologres+Flink构建易用、统一的企业级实时数仓。

阿里云实时数仓Hologres

103,038

赵世振

2025-01-07

2656

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

本课程旨在介绍阿里云百炼大模型平台的核心功能和应用场景，帮助开发者和技术小白快速上手，体验AI的强大能力，并探索企业级AI应用开发的可能性。

赵世振

2,656

官方博客-第14页-阿里云开发者社区

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

一文理解淘宝购物车背后的逻辑

RAG效果优化：高质量文档解析详解

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

几百T的视频、图片数据进行更有效地存储和管理

Paimon 与 Spark 的集成（二）：查询优化

使用Logtail采集MQTT协议数据

Hologres+Flink企业级实时数仓核心能力介绍

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点

官方博客-第14页-阿里云开发者社区

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

类目筛选

内容类型

大模型推理优化实践：KV cache复用与投机采样

一文理解淘宝购物车背后的逻辑

RAG效果优化：高质量文档解析详解

基于阿里云PAI平台搭建知识库检索增强的大模型对话系统

几百T的视频、图片数据进行更有效地存储和管理

Paimon 与 Spark 的集成（二）：查询优化

使用Logtail采集MQTT协议数据

Hologres+Flink企业级实时数仓核心能力介绍

阿里云百炼xWaytoAGI共学课DAY1 - 必须了解的企业级AI应用开发知识点