德灵

2024-05-15

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

115,081

喻奎

2023-06-25

10037

MaxCompute湖仓一体近实时增量处理技术架构揭秘

本文将介绍阿里云云原生大数据计算服务MaxCompute湖仓一体近实时增量处理技术架构的核心设计和应用场景。

喻奎

10,037

星舰正泽

2024-05-15

8263

通义千问API：找出两篇文章的不同

本章我们将介绍如何利用大模型开发一个文档比对小工具，我们将用这个工具来给互联网上两篇内容相近但版本不同的文档找找茬，并且我们提供了一种批处理文档比对的方案

星舰正泽

8,263

ModelScope

2024-05-15

1127

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,127

凡澈

2024-05-15

63624

为什么 Lettuce 会带来更长的故障时间

本文详述了阿里云数据库 Tair/Redis 将使用长连接客户端在非预期故障宕机切换场景下的恢复时间从最初的 900s 降到 120s 再到 30s的优化过程，涉及产品优化，开源产品问题修复等诸多方面。

凡澈

63,624

米基

2024-05-15

727

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

727

阿里云云原生

2024-07-29

101

从供应商深度绑定，到走向真正的云原生，他们是这样做的

没有 K8s 的运维权限，开发者也能排查和定位问题。

阿里云云原生

101

ModelScope

2024-05-15

861

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

861

隆基

2024-05-15

140676

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？

了解 RocketMQ 5.0 的核心概念和架构概览；然后我们会从集群角度出发，从宏观视角学习 RocketMQ 的管控链路、数据链路、客户端和服务端如何交互；学习 RocketMQ 如何实现数据的存储，数据的高可用，如何利用云原生存储进一步提升竞争力。

隆基

140,676

类目筛选

内容类型

阿里云PAI大模型RAG对话系统最佳实践

MaxCompute湖仓一体近实时增量处理技术架构揭秘

通义千问API：找出两篇文章的不同

在魔搭使用ComfyUI，玩转AIGC

为什么 Lettuce 会带来更长的故障时间

大模型推理优化实践：KV cache复用与投机采样

从供应商深度绑定，到走向真正的云原生，他们是这样做的

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

深度剖析 RocketMQ 5.0，架构解析：云原生架构如何支撑多元化场景？