如何让搜索随心所欲?一起来聊聊“以图搜图”-阿里云开发者社区

开发者社区> 数据库> 正文
登录阅读全文

如何让搜索随心所欲?一起来聊聊“以图搜图”

简介: 一张图片蕴含的价值远远超过自己本身。相对于传统的文字搜索,图片能给消费者带来更大的冲击力,图片蕴含的价值已成为电商的一个大金矿,我们怎样去挖掘这个金矿呢?博云视觉CEO陈杰在2016云栖大会•北京峰会上分享了以图搜图的电商搜索新模式。

一张好图可以胜过千言

电商行业里面最重要的是什么呢?毫无疑问,是搜索带来的流量。图片可以通过冲击视觉让人们产生想要购买的欲望。我们怎样去挖掘图片这个金矿?博云视觉CEO陈杰在2016云栖大会•北京峰会上分享了博云视觉在过去几个月的时间里和阿里云的合作,以及博云视觉在电商图片搜索上的实践。

图像搜索应用成趋势

在数据量方面,视觉在人类获取信息途径上占到了80%以上的比重。随着现在手机拍照功能的强大和应用的普及,人类拥有的图像也构成了一个非常大的图像数据库。根据统计,截止到目前为止,人类通过拍照的方式产生的图片大约接近三万亿幅。在这样一个海量的数据中,怎样去挖掘图像本身的价值,进而在大数据中去搜索相关的信息是一个新的挑战。

8f35b96da3d9a90e806c7f878b17d9dd42afac55

从最新的CNNIC发布的关于中国网民的搜索行为的调查报告(截止到2015年12月份)来看,人们通过手机端搜索的方式主要有文字、二维码、条形码以及图像和语音的技术。传统的文字搜索已经被大家使用了很多年,占到了搜索的96%,而图像作为信息的入口级渠道,以图搜图这种交互模式已经逐渐被接受。文字、语音都是人们已经定义好的一种描述信息,而图像除了已定义的可描述信息,还蕴含多种描述困难的信息。

这也是各大互联网公司开始抢滩图像市场的重要原因,我们看到各大互联网公司已经陆续推出图像搜索的应用或者功能,例如:百度识图、拍立淘、微信扫一扫、拍照购等,视觉搜索带来的流量也逐步开始扩张市场份额。

电商图搜应用场景

随着移动互联网技术的发展,通常在移动购物场景中会面临到几种情况:

一,我们在看直播节目或者电视节目时,我们可能对网红的某些产品感兴趣,想了解是否有同款,这个时候就很难描述这个产品是什么,这时候我们就需要图片;

二,我们在实时场景中看到前面一个人背的包,感兴趣但是无法描述;

三,社交平台上分享信息的时候,微商分享某种商品需要去淘宝等其他平台上该商品的价格;

四,最近比较火的跨境电商业务,海外的商品语言描述看不懂,这个时候就有一些不对称的信息。

所见所得的新交互模式

这些场景下,无论我们用语言还是文字都很难直接对场景进行一个直观的描述。然而,最简单的方式是直接拍照,把内容信息上传到图像搜索引擎,通过数据库搜索,精准的匹配到想要获得的信息。这就是“所见即所得”的新型的交互方式。

f4cb918c9b686d0a5a9bab1b727c0b27d7819cb9

这种交互方式由三个部分包括:智能前端,包括一些手机以及未来的可穿戴设备如智能眼镜等;中间是一个移动网络,包括3G、4G、WiFi;云端连接着大型的云计算平台——阿里云,提供各项的数据服务。在传统的电商数据库里面,最核心的应用数据是文本数据,包括商品的价格、信息、介绍等,我们称之为结构化的数据。使用文本搜索时,会面临描述障碍、信息不对称等各种问题。再看另外一个维度,在云端的数据库上,除了文本数据还有更大量的电商图像数据,我们称之为非结构化的数据。其实,我们也可以把这些非结构化数据索引起来提供同样的“以图搜图”的方式,有了这样的索引数据库之后,在移动购物场景中,只要掏出手机对着感兴趣的商品进行拍摄,把图像内容发送到服务器端,在大规模的图像数据库中进行图像的比对搜索,那么最终就可以通过以图搜图的方式找到目标商品的相关信息。这种图搜技术有最核心的两个特征:

紧凑视觉特征表示。移动终端直接提取低比特、低复杂度、高准确率的紧凑视觉特征,并发送到服务端进行搜索。

高性能图像搜索。基于紧凑视觉特征,单幅图像索引所需数据仅需约4K;高效的海量特征索引算法,解决超大规模图像非结构化数据搜索难题。

那么,怎样从图像中提取紧凑视觉特征来让计算机能看懂这样一个图像?

紧凑视觉特征表示

f8befe3c84fcdcc1af9f56d13259bbea8fab9c13

给定一张图像,首先要做的是在这个图像中做一个兴趣点的检测。兴趣点是指根据人类的视觉机理去发现能够刺激视觉的一些底层视觉特征。紧接着把兴趣点描述成一个特征,这样就形成了一个最原始的底层视觉特征。之后,利用博云视觉自主研发技术把原始抽出来的特征压缩到很小,在经过一个熵编码的环节最终产生一个非常紧凑的描述一个图像的特征码流。

博云图搜基于图像特征的表达技术以及特征的索引技术,开放成标准化API服务。用户可以直接调用API服务来在各自的应用中实现以图搜图。

面向电商行业,博云图搜推出了电商的专项搜索解决方案。用户可以把自有的图像数据通过SDK上传到阿里云平台,然后结合弹性计算、CDN网络、OSS存储的基础上调用图像搜索SDK实现对图像数据本身的管理、搜索、增删改等应用。结合上层可以做边看边买、拍照购物等与图像搜索相关的电商应用。

同时针对移动终端,博云图搜推出了能够直接提取紧凑视觉特征、减少实际应用中大规模并发查找的带宽占用、流量占用的应用。

下面通过两个具体案例讲解图像搜索在电商搜索中是如何应用的。

蕾丝企业案例

f31e80b99fc7623806a541d6712a188b62f61665

该行业的痛点是:采购商无法准确描述所要的蕾丝款式;数以万计的蕾丝花型,销售人员多无法记住;蕾丝工厂大量库存无法与客户需求精确匹配。针对上述痛点,博云视觉的企业客户之一,推出了一个蕾丝采购平台,“蕾丝小姐“APP,用户可以直接拍照上传,发送到云端,在众多后端产品库中查找相同或相似的目标蕾丝花型。这个平台建立了百万级蕾丝花型数据库,搜索平均准确率在80%以上。打开APP之后,直接可以通过打开拍照的方式对感兴趣的布料进行拍照,通过快速比对的图像搜索技术就可以查到与布料相同款或者相似款的供应商信息,并且可以点击相应的供应商进行后续的沟通。

红酒搜索的案例

3a0e53954f7040e150240257b6106003c4115295

用户可以拍摄葡萄酒瓶上的酒标,通过“以图搜图”直接获取相关信息。葡萄酒标图像识别准确率95%以上 。“酒靠谱”APP集成了百万量级葡萄酒数据,这些数据都在数据库端,我们可以直接拍照,然后发送紧凑视觉特征到云端进行搜索,这样我们就可以快速匹配出酒的款型、相应的酒标信息、评论信息、价格信息。具体的实际操作过程与上一个案例类似,这里不再赘述。

 

本文根据博云视觉CEO陈杰在2016云栖大会•北京峰会上的演讲整理而成。

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享: