带你读《阿里云产品六月刊》——十三、10分钟学会构建端到端的图片搜索服务(2)

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: 10分钟学会构建端到端的图片搜索服务

10分钟学会构建端到端的图片搜索服务(1):

https://developer.aliyun.com/article/new?spm=a2c6h.12873639.J_eBhO-wcawiLJRkGqHmozR.89.94de4a87TpymLX#/

一、购买向量检索版实例

1. 前置条件

 

成功注册阿里云账号并通过实名认证。

开通阿里云账号并登录控制台时,会提示先创建access key才能继续使用。

a、创建及使用应用依赖access key参数,主账号下access key参数不能为空。

 

b、在为主账号创建access key参数后,还可以再创建RAM子账号access key通过RAM子账号进行访问,RAM子账号赋予对应访问权限,请参考授权访问鉴权规则。(ps:子账号需要赋予AliyunSearchEngineFullAccess、AliyunSearchEngineReadOnlyAccess访问向量检索版实例的权限)。

 

需要用户拥有VPC环境,详情可点击此处进行查看。

2. 购买实例

进入OpenSearch控制台,商品版本选择向量检索版,根据业务情况进行规格选择和购买,具体参考购买指南

 

image.png

image.png

二、配置实例

新购买的实例,其状态为“待配置”,我们需要先完成配置后,才可正常搜索和测试。

 

配置实例的流程:1.表基础信息→2.数据同步→3.字段配置→4.索引结构→5.确认创建

 

image.png

 

 

1. 表基础信息

 

表名称:可以自定义。

分片数:请填写不超过256的正整数, 用于提升全量构建速度、单次查询性能。

数据更新资源数:数据更新所用资源数,每个索引默认免费提供2个4核8G的更新资源,超出免费额度的资源将产生费用,详情可参考向量检索版计费概述。

场景模板:选择「向量:图片搜索」。

 

image.png

 

2. 数据同步

 

配置全量数据来源,这里以API数据源为例,数据源类型选择API,并点击下一步。

image.png

 

3. 字段配置

 

向量检索版会根据选择的场景模板,预置相关字段,并会将全量数据来源中的字段,自动导入字段列表中。但由于在数据同步中我们选择的是API方式,所以不会同步全量数据来源中的字段,除了自动预设的字段外,我们还需要结合实际情况手动填写数据结构。

 

下图为表基础信息的「向量:图片搜索」 模板的系统预设字段,4个字段分别为id(主键)、source_image(原始图片)、source_image_vector(原图片经过内置的向量化模型处理后,生成的向量数据字段)、namespace(命名空间)。

 

image.png

 

字段配置中还需要在“source_image”的高级配置进行编辑。

 

image.png

 

字段source_image高级配置中有2个必填选项,其中向量化模型选择「clip 通用图片转向量模型」。数据类型有image(path)和image(base64编码)的选项,由于本文选择的是API的方式,所以数据类型选择「image(base64编码)」。

 

如果选择image(path),就需要填写OSS路径,其实就是把图片存在了OSS的文件夹里面,从oss直接导入。

如果选了image(base64编码),则相当于需要先把图片进行一次编码,然后存在数据库中,或者直接用API方式进行传输。

 

image.png

4. 索引结构

 

索引名称与向量字段名称相同,包含字段中的主键字段、向量字段已自动填写完成。

向量维度、实时索引、距离类型、向量索引算法可以根据业务情况填写。

在更多高级配置 展开中也可根据情况填写。

 

image.png

 

5. 确认创建

 

点击确认创建,等待实例状态为“正常”后,即可进行后续的搜索和测试。

 

image.png

image.png

 

三、添加数据和查询

1. 添加数据

在向量管理栏找到添加数据的页面,如果仅是单条数据的添加可以选择表单模式,多条数据的添加需要选择开发者模式。

 

1.1. 开发者模式(添加多条数据)

 

右上角选择开发者模式,添加相应字段值(包括表名、主键、需embedding 字段,图片字段可以通过填写base64编码的方式上传),点击添加。

 

image.png

可以先复制文章开头列举的base64编码进行尝试,添加完成后,当右下角的执行结果出现"message": "success" 说明数据上传成功。

 

1.2. 表单模式(仅添加单条数据)

 

添加必填字段,包含id、source_image(可以通过上传图片和填写base64编码的方式上传)。

 

image.png

 

添加完内容后,点击“添加”,当执行结果出现"message": "success"说明数据上传成功。

 

image.png

 

2. 观测数据写入

 

点击指标监控→表指标→选择表,在此页面可查看表的具体指标数据。

 

如果查看文档个数的话,需要确认数据写入后再进行查询(由于使用了内置模型进行向量化处理,所以数据写入需一定用时,大家可以通过自定义调节数据更新资源减少耗时)。

 

image.png

 

3. 查询测试

 

数据上传成功后,就可以在 向量管理→查询测试 页面进行查询,查询测试也同时支持表单模式/开发者模式两种。

 

image.png

 

举例使用表单模式进行查询测试,需要添加相应字段值,包含表名、Query类型(图片)、图片提供方式(可以通过上传图片和填写base64编码的方式上传),信息选择完毕后点击搜索。

 

image.png

 

 

参考:图片/base64编码

  image.png

 

 

可在搜索结果中查看主体识别的结果,本次采用的距离类型是SquaredEuclidean(欧式距离),所以距离分越小,结果越相关。


image.png

 

4. 多主体识别查询

 

回到查询测试页,选择表名,query类型(图片),图片提供方式(上传图片文件),多主体识别(开启),上传图片完成后,点击搜索。

 

image.png

 

多主体识别的结果,可以在搜索结果中查看,同时点击识别框序号,也可以切换不同主体搜索。

image.png

目录
相关文章
|
5月前
|
搜索推荐 API 对象存储
10分钟学会构建端到端的图片搜索服务
本文介绍在没有向量数据的情况下,怎样通过OpenSearch-向量检索版快速从零搭建图像搜索服务。
82778 69
|
4月前
|
分布式计算 搜索推荐 API
|
机器学习/深度学习 存储 算法
阿里云国际站:拍立淘-以图搜图中的图像搜索算法是怎么样的?
@luotuoemo飞机@TG 阿里云国际站:拍立淘-以图搜图中的图像搜索算法是怎么样的?图像搜索在现代搜索系统中扮演了重要角色,尤其在电子商务网站如阿里巴巴等,它更是一个必不可少的功能。拍立淘是阿里云国际站的一个以图搜图功能,它使用了复杂的图像搜索算法进行图片匹配和识别。以下是对该算法的简单描述。
|
机器学习/深度学习 人工智能 开发者
关于阿里云的图像搜索的创建和使用
关于阿里云的图像搜索的创建和使用
关于阿里云的图像搜索的创建和使用
|
存储 前端开发 Serverless
阿里云视觉智能平台提供了人脸识别和图像搜索的API接口
阿里云视觉智能平台提供了人脸识别和图像搜索的API接口
1668 0
|
人工智能
阿里云产品体系分为6大分类——人工智能——分为10种模块——图像搜索
阿里云产品体系分为6大分类——人工智能——分为10种模块——图像搜索自制脑图
179 0
|
SQL 搜索推荐 TensorFlow
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
“图片搜索”是作为导购类网站,比较常见的一种功能,其实现的方式也有多种。但如何做到快速、精准、简单等特性,本文给你答案。
11582 1
【最佳实践】阿里云 Elasticsearch 向量检索4步搭建“以图搜图”搜索引擎
|
算法
阿里云图像搜索技术创新-工业五金图片搜索
阿里云图像搜索产品3月17日正式发布工业五金搜索模型,通过大规模算法模型训练,可在海量五金图片素材中快速定位到图片中五金件的同款或相似款商品原图,识别过程中可有效避免图片方位变化、光照变化、背景场景变化等情况对搜索结果的影响。以此帮助工业五金电商商城、仓库等快速找到同款、相似款。通过输入工业五金类图片,可以在海量商品库中找到同款、相似款配件,并返回对应的配件信息,提升五金类产品购物效率,帮忙更多工业五金制造和零售等企业轻松上云。
513 57
阿里云图像搜索技术创新-工业五金图片搜索
|
算法
阿里云图像搜索应用篇-家具家居图片搜索
阿里云图像搜索产品于2022年3月17日正式发布家具家居图像搜索模型,通过大规模算法模型训练,可在海量图片素材中快速定位到与原图中的同款或相似款家居或家具图片,识别过程中可有效避免图片翻转、局部、颜色变换、款式微调、花纹变换等情况对搜索结果的影响,针对床上用品、家具、室内设计图等多个场景可快速找到相似图片或商品。可广泛应用于室内设计图片素材网站、 家纺类电商网站、家具家居类电商网站以及各种内容导购网站等。
598 0
阿里云图像搜索应用篇-家具家居图片搜索
|
机器学习/深度学习 存储 搜索推荐
阿里云图像搜索批量操作Quick Start
图像搜索(Image Search)以深度学习和机器视觉技术为核心,提取图片内容特征、建立图像搜索引擎,是一款用于图片间相似性检索的平台型产品。用户输入图片,可以快速在图片库中检索到与输入图片相似的图片集合。结合不同的行业和业务场景,图像搜索可广泛的应用于拍照购物、商品推荐、版权保护、图片相似推荐等场景。图像搜索可以通过批量操作功能批量导入阿里云OSS中的图片,或批量删除已经入库的图片,适用于较大规模的离线图片数据操作,稳定性高、速度快、操作方便。本文以商品图片搜索演示图片批量新增以供参考。
6848 0
阿里云图像搜索批量操作Quick Start