惜元

2024-05-15

2074

从Citus深度解密如何基于PostgreSQL做分布式数据库

前言分布式数据库能够解决海量数据存储、超高并发吞吐、大表瓶颈以及复杂计算效率等单机数据库瓶颈难题，当业务体量即将突破单机数据库承载极限和单表过大导致性能、维护问题时，分布式数据库是解决上述问题的高性价比方案。数据库作为分布式改造的最大难点，就是"和使用单机数据库一样使用分布式数据库"，这也一直是广大...

惜元

2,074

灵杰开发者

2024-08-16

11390

RAG效果优化：高质量文档解析详解

本文介绍了如何通过高质量的文档解析提升RAG系统整体的效果。

灵杰开发者

11,390

凡澈

2024-05-15

64108

为什么 Lettuce 会带来更长的故障时间

本文详述了阿里云数据库 Tair/Redis 将使用长连接客户端在非预期故障宕机切换场景下的恢复时间从最初的 900s 降到 120s 再到 30s的优化过程，涉及产品优化，开源产品问题修复等诸多方面。

凡澈

64,108

雅纯

2024-05-15

101389

一文搞懂需求流程规范的制定方法和落地技巧

随着业务和产品的发展、团队的不断扩大，很多团队都不可避免的会遇到需求流程混乱的问题。虽然有的团队也编写了一些“需求流程规范”的文档，但最终却流于纸面，难以在团队真正落地。如何科学制定并有效落实需求管理规范呢？对此，云效产品经理陈逊进行了非常详细的直播分享，本文是他经验的文字总结。

雅纯

101,389

德灵

2024-05-15

115469

阿里云PAI大模型RAG对话系统最佳实践

本文为大模型RAG对话系统最佳实践，旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术，从而显著提升对话系统的性能，使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践，您可以掌握构建一个大模型RAG对话系统的完整开发链路。

德灵

115,469

米基

2024-05-15

1014

大模型推理优化实践：KV cache复用与投机采样

在本文中，我们将详细介绍两种在业务中实践的优化策略：多轮对话间的 KV cache 复用技术和投机采样方法。我们会细致探讨这些策略的应用场景、框架实现，并分享一些实现时的关键技巧。

米基

1,014

ModelScope

2024-05-15

1035

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

MiniCPM-V 2.0 不仅带来优秀端侧多模态通用能力，更带来惊艳的 OCR 表现。通过自研的高清图像解码技术，可以突破传统困境，让更为精准地识别充满纷繁细节的街景、长图在端侧成为可能。

ModelScope

1,035

ModelScope

2024-05-15

1403

在魔搭使用ComfyUI，玩转AIGC

ComfyUI是一个功能强大、模块化程度高的AIGC图形和视频生成的用户界面和后台。

ModelScope

1,403

恭常

2024-09-04

146

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型

检索增强生成（RAG）结合检索与生成技术，利用外部知识库提升大模型的回答准确性与丰富性。RAG的关键组件包括文本表示模型和排序模型，前者计算文本向量表示，后者进行精细排序。阿里巴巴通义实验室推出的GTE-Multilingual系列模型，具备高性能、长文档支持、多语言处理及弹性向量表示等特性，显著提升了RAG系统的检索与排序效果。该系列模型已在多个数据集上展示出优越性能，并支持多语言和长文本处理，适用于各种复杂应用场景。

恭常

146

类目筛选

内容类型

从Citus深度解密如何基于PostgreSQL做分布式数据库

RAG效果优化：高质量文档解析详解

为什么 Lettuce 会带来更长的故障时间

一文搞懂需求流程规范的制定方法和落地技巧

阿里云PAI大模型RAG对话系统最佳实践

大模型推理优化实践：KV cache复用与投机采样

新一代端侧模型，面壁 MiniCPM 2.0开源，魔搭社区最佳实践

在魔搭使用ComfyUI，玩转AIGC

【算法精讲系列】MGTE系列模型，RAG实施中的重要模型