索引

首页 标签 索引
# 索引 #
关注
67252内容
|
1天前
|
向量相似性搜索详解:Flat Index、IVF 与 HNSW
向量搜索解决非结构化数据(如文本、音频)的语义检索难题。关系型数据库擅长精确匹配结构化数据,而向量数据库通过Embedding将语义转化为向量,并利用余弦相似度、Flat Index、IVF、HNSW等算法实现高效近邻搜索,兼顾精度与速度。
|
2天前
| |
来自: 云存储
Vector 基于多索引表架构应对海量多租户的大规模向量检索
OSS 向量 Bucket 支持多索引架构,通过按租户/业务创建独立索引,实现数据隔离、并发检索与结果合并,兼顾高安全性与毫秒级响应,轻松应对千万级向量的多租户 RAG 与语义搜索场景。
|
2天前
| |
来自: 云存储
Vector 构建原始文件和向量数据之间的映射关系
OSS 向量 Bucket 的检索结果返回的是向量 Key 和 Metadata,而非原始文件本身。要将检索结果关联回原始文件(如图片、文档、视频),需要在写入向量时构建映射关系。
|
2天前
| |
来自: 云存储
高并发场景下,如何让你的向量语义检索快人一步?
当需要同时检索多条查询(如批量问答、RAG 多路召回、多用户并发搜索),逐条串行执行会导致整体耗时随查询数线性增长。通过并发执行多条检索请求,可以将总耗时从 N × 单次延迟 降低到接近 1 × 单次延迟,显著提升吞吐量。本文介绍两种并发方式:CLI 并发和 SDK 并发,适用于批量语义搜索、 RAG 多路召回、多模态批量检索等场景。
|
2天前
| |
来自: 云原生
从 OpenSearch 到阿里云 SLS:极致弹性、更低成本、生态兼容
本文围绕"让可观测更简单"展开。通过将OpenSearch数据接入SLS,在单一平台完成数据加工、查询分析、看板展示与告警,消除跨系统跳转与口径不一致。提供成本对比与落地路径,助力团队降低成本、轻化运维、加快上线,构建完整可观测闭环。
|
2天前
|
SpringBoot整合MongoDB,性能提升,优化实践
SpringBoot与MongoDB的整合提供了高效、灵活的数据存储方案,特别适合处理半结构化、快速增长的数据场景。
|
2天前
| |
从“词元”到“符元”:Token 中文名背后的 AI 底层认知之争
在“Token”被定名为“词元”之后,本文从计算本体、多模态演进与回译一致性等角度指出,该命名存在路径依赖与语义锚定问题。Token本质是跨模态的离散符号单元,而非语言“词”。相比之下,“符元”更能对齐计算本质,具备长期稳定性与认知一致性。
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
java工具:《对Collections.sort排序后我想制定查询几条,比如list有10条,我只想获取前4条》
|
2天前
|
阿里云/本地部署OpenClaw、配置大模型、搭建记忆系统教程及常见问题解答
2026年,OpenClaw(原Clawdbot)作为开源AI自动化框架的代表,突破性地采用“形式-功能-动态”三维记忆架构,通过Token-level(符号记忆)、Parametric(权重记忆)、Latent(向量记忆)三种物理形式,实现事实存储、经验积累与上下文管理的全场景覆盖。搭配阿里云千问大模型或免费Coding Plan API,可让智能体真正“记住”用户偏好、任务经验与知识规则,彻底摆脱传统LLM的“无状态困境”。
|
3天前
|
1688 图片搜索逆向工程与多模态搜索融合实践 —— 基于 CLIP 模型的特征向量落地
本文分享了合规逆向1688 APP图片搜同款功能的完整实践:通过抓包与反编译厘清请求逻辑,破解动态签名算法,并融合CLIP多模态特征与Faiss向量检索,显著提升搜款准确率(62%→91%)与效率(3秒出结果)。全程基于公开产品分析,严守法律红线。
免费试用