方案介绍
本方案介绍用户在没有向量数据的情况下,通过直接导入图片源数据,在OpenSearch内部便捷完成图片向量化、向量搜索等步骤,实现以图搜图、以文搜图等多种图像检索能力。
方案预估:体验本方案预计费用不超过5元(假设选择最低规格资源,查询节点2核8GB、云盘型,数据节点2核16GB、云盘型,单数据节点存储空间100GB,且资源运行时间不超过120分钟。如调整了资源规格,请以控制台显示的实际报价以及最终账单为准)
应用场景
- 以图搜图
图搜购物、相似物品引流、同款比价
- 文本搜图
通过描述图片内容搜索图片
- 拍照搜题
题目搜索、拍照翻译、OCR
- 图片识别
人脸识别、版权保护
方案架构图
方案优势
- 向量算法
OpenSearch支持 Linear(暴力检索)、QC(聚类)、HNSW三种算法。
其中QC算法,是基于量化聚类的向量检索算法,召回结果正确率极高,占用资源较少,性能较好,在低维度向量数据集上有更好表现,内存及存储占用只有Linear和HNSW的1/4,适用于对召回率没有严苛要求的大数据量检索场景。
HNSW是基于图的向量检索算法,召回率极高且性能较好,内存及存储占用与Linear相当,在低维度和高维度向量数据集上均有很好的表现,适用于大多数向量检索场景。
- 向量化能力
OpenSearch内置向量embedding模型,支持直接导入图片/文本源数据,在OpenSearch内部一站式完成图片向量化和向量检索。
已支持模型:
- clip图片转向量通用模型
- clip图片转向量电商行业增强模型
- 数据源支持
支持从其他阿里云数据库产品导入数据,进行索引构建与检索,降低数据批量导入成本。
目前支持:
- MaxCompute
- OSS
- 索引版本热切换
OpenSearch后端管控提供了索引版本热切换能力,可实现不重启服务即切换索引版本(内部动态rolling切换),提升整体服务稳定性。