索引

首页 标签 索引
# 索引 #
关注
67130内容
什么是向量数据库 —— 零基础也能懂的核心概念
本文用生活化案例零基础解读向量数据库:它本质是“存向量、找相似”的工具,将文本/图片等转为数字向量,通过相似度检索解决大模型知识滞后与幻觉问题。涵盖向量化原理、与传统数据库区别、RAG实战流程及核心价值,附实操入口,助新手快速上手。(239字)
|
8天前
|
深度拆解:一套最小可用的向量数据库是如何从代码堆里长出来的?
本文带你从零手搭向量数据库,深入拆解Embedding、向量压缩与ANN三大核心原理,避开“调包侠”陷阱;通过FAISS实战构建语义检索系统,涵盖向量化、索引、精排、元数据过滤全流程,并提供可落地的评估方法与工程避坑指南。(239字)
零门槛上手Agent核心实用技能
想让你的AI助手不再只会聊天,而是能稳定、精准地完成周报撰写、合同审查等复杂任务吗?Agent Skills就是将零散提示词升级为可复用、可管理的工程能力的关键。本文将为你拆解Skill的抽象模型、三层加载结构及模块化设计,手把手教你构建专属的高频独家能力,让AI从“聪明的助手”进化为“可靠的专业执行者”。
向量数据库从零搭建:文本语义检索实战与工程要点
本文记录作者从零搭建向量数据库的实践历程:始于“只想用现成方案”,却因检索抖动、参数敏感、延迟飙升等真实问题,被迫深入理解其工程本质。全文以构建最小可用文本语义检索系统为目标,清晰拆解八大关键环节——embedding选型、向量存储与压缩、暴力检索的局限、ANN近似搜索的必要性、索引取舍、查询路径设计、元数据融合及性能瓶颈识别。强调:搭建不是为了替代成熟产品,而是为了真正掌握向量数据库的底层逻辑与工程权衡。
|
9天前
|
分布式搜索引擎:底层逻辑 + 实战
本文深入剖析分布式搜索引擎核心原理,涵盖倒排索引、分片机制、副本高可用、集群架构、分布式事务及相关性排序,结合ES 8.14+SpringBoot3实战,兼顾底层逻辑与生产优化,助开发者从“会用”进阶到“精通”。
|
9天前
| |
来自: 计算巢
百万上下文与 RAG 的协同实践:企业级知识系统架构解析
本文探讨企业知识系统落地的务实路径:摒弃RAG与长上下文“二选一”的极端,提出“RAG精准检索+长上下文深度推理+全链路治理”协同架构。涵盖业务目标、协同价值、分层架构、路由策略、上下文优化、成本管控及权限审计,并提供可复用的Mermaid架构图与渐进式落地建议。
|
9天前
|
火语言 RPA:网页标题采集 + AI 智能优化自动化流程
本案例基于火语言RPA,实现“网页标题采集→AI改写→Excel双列对比”自动化流程:批量抓取网页标题,调用内置或第三方AI(如DeepSeek/Kimi)简洁优化,自动分存原标题(A列)与新标题(B列),支持内容运营高效优化。
awk高级用法——内置变量、函数与进阶技巧
本文深入讲解awk进阶核心:内置变量(NR/FNR/NF/FS/OFS/FILENAME/ARGC/ARGV等)与内置函数(length/substr/index/gsub等),涵盖行字段统计、多文件处理、动态分隔符、字符串操作等高频场景,配丰富实操示例,助你从入门迈向精通。
|
10天前
|
什么是 GEO(Generative Engine Optimization)技术白皮书
GEO(生成式引擎优化)是面向AI搜索与大模型的新型信息工程,旨在提升医疗专业内容在AI答案中的引用率、可信度与稳定性。它不争网页排名,而争AI决策中的“权威席位”,助力医疗机构在零点击时代抢占认知入口,构建可控、合规、可持续的生成式信任资产。(239字)
一文读懂向量数据库:从核心概念到实际应用
本文精析向量数据库核心能力、优势(毫秒级相似检索、原生支持非结构化数据)与痛点(精度/效率难兼得、成本高、运维复杂),对比Milvus/Chroma/FAISS等开源方案及Pinecone/Zilliz商业产品,提供AI开发者高效选型指南。(239字)
免费试用