凡澈

2024-05-15

为什么 Lettuce 会带来更长的故障时间

本文详述了阿里云数据库 Tair/Redis 将使用长连接客户端在非预期故障宕机切换场景下的恢复时间从最初的 900s 降到 120s 再到 30s的优化过程，涉及产品优化，开源产品问题修复等诸多方面。

凡澈

64,144

德灵

2024-05-15

115512

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

115,512

王明橙鲤黄俊

2024-05-15

62095

通义千问开源模型在PAI灵骏的最佳实践

本文将展示如何基于阿里云PAI灵骏智算服务，在通义千问开源模型之上进行高效分布式继续预训练、指令微调、模型离线推理验证以及在线服务部署。

王明橙鲤黄俊等

62,095

ModelScope

2024-05-15

1424

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,424

米基

2024-05-15

1048

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

1,048

阿里云百炼

2024-07-03

547

阿里云百炼模型入门篇-大语言模型

本文主要介绍如何快速的通过阿里云百炼，带你如何快速入门通义千问系列大语言模型。

阿里云百炼

547

骆天

2024-05-15

1050

高并发架构设计三大利器：缓存、限流和降级

软件系统有三个追求：高性能、高并发、高可用，俗称三高。本篇讨论高并发，从高并发是什么到高并发应对的策略、缓存、限流、降级等。

骆天

1,050

阿里云云原生

2024-07-30

851

5 大场景上手通义灵码企业知识库问答

通义灵码在企业版里还引入了一个超酷的新技能：RAG（Retrieval-Augmented Generation）检索增强生成的能力，本文就跟大家分享下企业知识库能帮开发者做些什么。

阿里云云原生

851

阿里云云原生

2024-09-02

113

通义灵码使用安装教程，3 分钟快速上手体验

通义灵码，是阿里云与通义实验室联合出品的一款基于通义大模型的智能编码辅助工具，提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力，并针对阿里云的云服务使用场景调优，助力开发者高效、流畅的编码。目前个人版免费使用。

阿里云云原生

113

类目筛选

内容类型

为什么 Lettuce 会带来更长的故障时间

阿里云PAI大模型RAG对话系统最佳实践

通义千问开源模型在PAI灵骏的最佳实践

在魔搭使用ComfyUI，玩转AIGC

大模型推理优化实践：KV cache复用与投机采样

阿里云百炼模型入门篇-大语言模型

高并发架构设计三大利器：缓存、限流和降级

5 大场景上手通义灵码企业知识库问答

通义灵码使用安装教程，3 分钟快速上手体验