阿里云云原生

2024-09-02

基于 RocketMQ 的云原生 MQTT 消息引擎设计

本文将介绍阿里云如何将 Serverless 架构应用于消息队列，有效降低运营成本，同时利用云原生环境的特性，为 IoT 设备提供快速响应和灵活伸缩的通讯能力。

阿里云云原生

69

米基

2024-05-15

918

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

918

子丑

2024-07-22

15537

超越流水线，企业研发规范落地新思路

一文详解研发规范的目标、常见误区、选型方法与常见最佳实践。

子丑

15,537

德灵

2024-05-15

115366

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

115,366

阿里云云原生

2024-08-21

571

用好通义灵码，让这款 AI 编码助手帮你做更多工作

通义灵码提供了一系列快捷键和配置选项以增强开发体验。

阿里云云原生

571

ModelScope

2024-05-15

1007

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

本期文章，我们将向大家展示如何使用AgentScope中构建和使用具有RAG功能的智能体，创造AgentScope助手群，为大家解答和AgentScope相关的问题。

ModelScope

1,007

计缘

2024-09-02

56

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

本文带大家了解一下如何使用阿里云Serverless计算产品函数计算构建生产级别的LLM Chat应用。该最佳实践会指导大家基于开源WebChat组件LobeChat和阿里云函数计算（FC）构建企业生产级别LLM Chat应用。实现同一个WebChat中既可以支持自定义的Agent，也支持基于Ollama部署的开源模型场景。

计缘

56

翊云

2024-08-15

215

MySQL实现并发控制的过程

数据库系统到底是怎么进行并发访问控制的？本文以 MySQL 8.0.35 代码为例，尝试对 MySQL 中的并发访问控制进行整体介绍。

翊云

215

阿里云云原生

2024-08-26

348

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力

本⽂对 Prompt 的使用方式进行了简单介绍，让大家了解到 Prompt 对于 LLM 的重要性。并尝试在 Prompt 中结合用户 Geo IP 信息，实现 LLM 的个性化回复，提升问答的准确度。

阿里云云原生

348

类目筛选

内容类型

基于 RocketMQ 的云原生 MQTT 消息引擎设计

大模型推理优化实践：KV cache复用与投机采样

超越流水线，企业研发规范落地新思路

阿里云PAI大模型RAG对话系统最佳实践

用好通义灵码，让这款 AI 编码助手帮你做更多工作

Multi-Agent实践第5期：RAG智能体的应用：让AgentScope介绍一下自己吧

基于阿里云函数计算（FC）x 云原生 API 网关构建生产级别 LLM Chat 应用方案最佳实践

MySQL实现并发控制的过程

AI 网关基于 IP 地理位置，增强 Prompt 修饰能力