索引

首页 标签 索引
# 索引 #
关注
67122内容
向量数据库从零搭建:文本语义检索实战与工程要点
本文记录作者从零搭建向量数据库的实践历程:始于“只想用现成方案”,却因检索抖动、参数敏感、延迟飙升等真实问题,被迫深入理解其工程本质。全文以构建最小可用文本语义检索系统为目标,清晰拆解八大关键环节——embedding选型、向量存储与压缩、暴力检索的局限、ANN近似搜索的必要性、索引取舍、查询路径设计、元数据融合及性能瓶颈识别。强调:搭建不是为了替代成熟产品,而是为了真正掌握向量数据库的底层逻辑与工程权衡。
|
5小时前
|
分布式搜索引擎:底层逻辑 + 实战
本文深入剖析分布式搜索引擎核心原理,涵盖倒排索引、分片机制、副本高可用、集群架构、分布式事务及相关性排序,结合ES 8.14+SpringBoot3实战,兼顾底层逻辑与生产优化,助开发者从“会用”进阶到“精通”。
|
6小时前
| |
来自: 计算巢
百万上下文与 RAG 的协同实践:企业级知识系统架构解析
本文探讨企业知识系统落地的务实路径:摒弃RAG与长上下文“二选一”的极端,提出“RAG精准检索+长上下文深度推理+全链路治理”协同架构。涵盖业务目标、协同价值、分层架构、路由策略、上下文优化、成本管控及权限审计,并提供可复用的Mermaid架构图与渐进式落地建议。
|
8小时前
|
火语言 RPA:网页标题采集 + AI 智能优化自动化流程
本案例基于火语言RPA,实现“网页标题采集→AI改写→Excel双列对比”自动化流程:批量抓取网页标题,调用内置或第三方AI(如DeepSeek/Kimi)简洁优化,自动分存原标题(A列)与新标题(B列),支持内容运营高效优化。
|
9小时前
|
awk高级用法——内置变量、函数与进阶技巧
本文深入讲解awk进阶核心:内置变量(NR/FNR/NF/FS/OFS/FILENAME/ARGC/ARGV等)与内置函数(length/substr/index/gsub等),涵盖行字段统计、多文件处理、动态分隔符、字符串操作等高频场景,配丰富实操示例,助你从入门迈向精通。
|
22小时前
|
什么是 GEO(Generative Engine Optimization)技术白皮书
GEO(生成式引擎优化)是面向AI搜索与大模型的新型信息工程,旨在提升医疗专业内容在AI答案中的引用率、可信度与稳定性。它不争网页排名,而争AI决策中的“权威席位”,助力医疗机构在零点击时代抢占认知入口,构建可控、合规、可持续的生成式信任资产。(239字)
|
1天前
| |
来自: 计算巢
虚拟机数据恢复—服务器存储断电删vmdk文件后虚拟机数据如何起死回生?
本次数据恢复涉及一台R710系列服务器和一台MD3200系列存储,上层是ESXI5.5版本的虚拟机和虚拟文件。因客户机房非正常断电,虚拟机无法启动。机房管理员检查发现虚拟机配置文件丢失,但xxx-flat.vmdk磁盘文件和xxx-000001-delta.vmdk快照文件还在。管理员尝试恢复时,删除了原虚拟机内的xxx-flat.vmdk,新建了一个虚拟机,分配了200GB精简模式和160GB快照数据盘,然而原虚拟机数据未恢复。
|
1天前
|
从零到一:向量数据库到底在存什么?大模型开发者必备指南
本文用生活化语言揭秘向量数据库:它是大模型的“超级图书馆”,将文本、图像等转为数字向量(如苹果→[1,1,1,1]),实现语义相似检索。详解RAG知识库构建三步法——切片、向量化、检索增强,并对比传统数据库,强调其“找相似”而非“找精确”的核心价值。
|
1天前
|
高效转换Word表格为Excel:Python方案全解析
本文介绍如何用Python自动化将Word表格转为Excel,解决手动复制易出错、耗时长等问题。基于python-docx读取表格,结合openpyxl或pandas写入,支持多表合并、数字格式识别、合并单元格处理及大文件优化,30行代码即可实现高效精准转换。(239字)
|
2天前
| |
来自: 数据库
基于 VectorDBBench 的性能评测与架构解析:Lindorm 向量引擎的优化实践
阿里云Lindorm向量检索服务重磅升级,依托CBO/RBO混合优化器与自适应混合索引,实测QPS达5.6万(百万级)、2.4万+(千万级),P99延迟低至2ms,融合检索性能行业领先,全面支撑AI时代高并发、低延迟、强一致的生产级向量应用。
免费试用