LEANN:一个极简的本地向量数据库

简介: LEANN是面向RAG的轻量级嵌入式向量数据库,如SQLite般无需服务依赖,可在本地运行。它通过图结构与选择性重计算,节省97%存储且不损精度,让笔记本也能高效检索百万文档,兼顾隐私与性能,堪称个人AI搜索引擎。

在软件开发领域,提到轻量级、嵌入式的本地数据库,我们首先会想到 SQLite,它快速且无需独立服务进程。现在检索增强生成(RAG)和向量数据库的世界里,一个定位相似的新工具出现了。你可以把LEANN看作是嵌入式、轻量级的向量数据库。它完全不需要依赖庞大的数据中心或者 GPU 集群。一个个人专属的 RAG 引擎,它能完全放在你的笔记本电脑里,可以索引和搜索数百万份文档,而且最不可思议的是,它比常规向量数据库少用了 97% 的存储空间,而且**准确性还没有任何损失。

LEANN 的核心技术差异

传统的向量数据库简直就是存储“巨兽”。它们为每一个文档都预先计算好嵌入(Embeddings)并全部存储下来,磁盘空间很快就会被塞满。LEANN则不一样:

它压根儿不存储所有嵌入,而是采用一种基于图的选择性重计算方法,并辅以高保留度的修剪(Pruning)。这几个术语听起来有点花哨,但核心思想很简单:只在真正需要时,才去计算必需的数据

LEANN 不是一个嵌入数据的“囤积者”,它会按需重新计算嵌入,并通过一个非常轻量级的图结构将它们智能地连接起来。这让存储用量大幅下降,而图结构则确保了语义相似性和检索准确性得以完整保留。

为什么这项技术值得关注

有了 LEANN,你的笔记本电脑瞬间就能变身成一个个人 AI 搜索引擎。所有这些功能都在本地跑起来没有一分钱的云服务开销隐私也得到了绝对保障

如果你使用 Claude Code,应该知道它目前的搜索能力只停留在基本的关键词匹配。LEANN 可以无缝接入,作为 MCP(Model Context Protocol)服务,为你的模型增加真正的语义检索能力,让你搜索的是“意义”,而不是单纯的“词语”。而且整个过程中你都不需要改变原有的工作流程。

机制解析

LEANN 之所以强大,关键在于它修剪掉了大量的“赘肉”

  • 基于图的重计算从根本上消除了对大型嵌入仓库的需求。
  • 使用 CSR(Compressed Sparse Row,压缩稀疏行)格式修剪的图,显著降低了存储的额外开销。
  • 智能缓存与重计算逻辑在检索速度和磁盘使用之间找到了一个绝佳的平衡点。

这些优化结合起来创造了一个既轻量又具备可扩展性的系统。这是一个能装进你笔记本电脑、却能处理数百万记录的数据库。

快速上手

上手 LEANN 非常简单,代码如下:

#git clone https://github.com/yichuan-w/LEANN.git leann  
#cd leann  
#uv pip install leann  

from leann import LeannBuilder, LeannSearcher, LeannChat  
from pathlib import Path  
INDEX_PATH = str(Path("./").resolve() / "demo.leann")  

# Build an index  
builder = LeannBuilder(backend_name="hnsw")  
builder.add_text("LEANN saves 97% storage compared to traditional vector databases.")  
builder.add_text("Tung Tung Tung Sahur called—they need their banana‑crocodile hybrid back")  
builder.build_index(INDEX_PATH)  

# Search  
searcher = LeannSearcher(INDEX_PATH)  
results = searcher.search("fantastical AI-generated creatures", top_k=1)  

# Chat with your data  
chat = LeannChat(INDEX_PATH, llm_config={"type": "hf", "model": "Qwen/Qwen3-0.6B"})  
response = chat.ask("How much storage does LEANN save?", top_k=1)

总结

LEANN 的出现,标志着向量数据库领域正在迎来自己的 SQLite 时刻。SQLite 的成功在于它提供了轻量级、零配置、无服务器的本地数据管理能力,它让应用开发者可以轻松地在边缘设备、桌面应用中嵌入强大的 SQL 能力。

LEANN 也在做同样的事情,但它针对的是 RAG 和语义搜索能力。它能够将数百万条嵌入向量存放在本地文件中还能快速检索,对于那些需要构建离线应用、移动端 AI 功能或纯粹关注个人数据隐私的开发者而言,LEANN 提供了一种开箱即用的、极度高效的解决方案。所以有兴趣的赶紧试试吧。
https://avoid.overfit.cn/post/1b13106d6d7a46f2adebc33bc49ff8d8

目录
相关文章
|
18天前
|
人工智能 JSON 缓存
CrewAI 上手攻略:多 Agent 自动化处理复杂任务,让 AI 像员工一样分工协作
CrewAI 是一个基于 Python 的自主 AI 智能体编排框架,可构建“虚拟团队”协同完成复杂任务。通过定义角色明确的 Agents、任务流 Tasks、协作流程 Processes 及可用工具 Tools,实现研究、写作、开发等多环节自动化。适用于长链条工作流,如研报生成、竞品分析、软件开发等,支持异步执行、人工介入与结构化输出,集成主流大模型与工具生态,是处理复杂知识型任务的高效选择。(238 字)
148 0
CrewAI 上手攻略:多 Agent 自动化处理复杂任务,让 AI 像员工一样分工协作
|
9天前
|
机器学习/深度学习 传感器 算法
BipedalWalker实战:SAC算法如何让机器人学会稳定行走
本文探讨基于Soft Actor-Critic(SAC)算法的下肢假肢自适应控制。传统方法依赖精确建模,难以应对复杂环境变化。SAC通过最大熵强化学习,使假肢在仿真中自主探索、学习稳定步态,具备抗干扰与容错能力。结合生物工程视角,将神经网络映射为神经系统,奖励函数关联代谢效率,实现从试错到自然行走的演化。相位图分析显示极限环形成,标志动态稳定步态建立,能效曲线表明后期动作更节能。研究为智能假肢迈向临床应用提供新思路。
217 117
BipedalWalker实战:SAC算法如何让机器人学会稳定行走
|
13天前
|
机器学习/深度学习 人工智能 缓存
让AI评测AI:构建智能客服的自动化运营Agent体系
大模型推动客服智能化演进,从规则引擎到RAG,再到AI原生智能体。通过构建“评估-诊断-优化”闭环的运营Agent,实现对话效果自动化评测与持续优化,显著提升服务质量和效率。
363 18
让AI评测AI:构建智能客服的自动化运营Agent体系
|
22天前
|
自然语言处理 JavaScript 前端开发
理解JavaScript闭包:从入门到实战
理解JavaScript闭包:从入门到实战
216 118
|
26天前
|
Ubuntu 测试技术 数据处理
QF-Lib:用一个库搞定Python量化回测和策略开发
QF-Lib 是一个一体化的量化金融研究工具库,涵盖数据获取、策略回测、风险分析到报告生成全流程。支持多数据源接入与前瞻偏差防护,基于事件驱动架构,内置专业金融函数,模块化设计便于扩展,可快速搭建策略原型并自动生成PDF/Excel报告,提升量化研究效率。
286 3
QF-Lib:用一个库搞定Python量化回测和策略开发
|
12天前
|
人工智能 JSON 机器人
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
AI Agent并非玄学,核心仅为“循环 + 大模型 + 工具函数”。本文教你用Gemini 3从零搭建能读写文件、执行指令的命令行助手,拆解其“观察-思考-行动”循环机制,揭示智能体背后的简洁本质。
230 17
从零开始:用Python和Gemini 3四步搭建你自己的AI Agent
|
11天前
|
存储 缓存 人工智能
腾讯新闻 item_search - 热榜数据接口对接全攻略:从入门到精通
腾讯新闻item_search热榜接口是获取其全领域(时政、科技、财经等)实时热点数据的核心工具,支持多维度筛选与分页查询,可高效获取标题、热度指数、传播数据及关联话题,广泛应用于舆情监测、资讯聚合与热点分析,助力开发者精准掌握平台热点动态。
|
27天前
|
存储 人工智能 自然语言处理
HaluMem:揭示当前AI记忆系统的系统性缺陷,系统失效率超50%
AI记忆幻觉频发:刚升职就被遗忘,喜欢的书被记错。问题根源在于记忆系统“捏造、错误、冲突、遗漏”。新研究HaluMem首次实现操作级评估,揭示当前AI记忆提取与更新全面失效,为构建可信AI指明方向。
125 8
HaluMem:揭示当前AI记忆系统的系统性缺陷,系统失效率超50%
|
4天前
|
存储 人工智能 自然语言处理
Gemini 2.5 Flash / Nano Banana 系统提示词泄露:全文解读+安全隐患分析
本文揭示了Nano Banana的内部系统指令,展示其如何通过“描绘不等于认可”原则,将图像生成请求无条件传递给下游模型,禁止自身进行内容审查。该机制凸显“先生成、后过滤”的安全架构,引发对生成边界与伦理的深层思考。
81 6
Gemini 2.5 Flash / Nano Banana 系统提示词泄露:全文解读+安全隐患分析
|
1天前
|
人工智能 搜索推荐 开发者
GEO 驱动商业增长:非标行业如何通过新闻源布局,抢占 AI 推荐入口
AI正重塑非标行业获客逻辑,GEO优化成关键。通过结构化内容、多源交叉验证与精准新闻源布局,低成本提升AI推荐概率,抢占客户决策入口,实现高效转化。