如何让搜索随心所欲?一起来聊聊“以图搜图”

本文涉及的产品
图像搜索,任选一个服务类型 1个月
简介: 一张图片蕴含的价值远远超过自己本身。相对于传统的文字搜索,图片能给消费者带来更大的冲击力,图片蕴含的价值已成为电商的一个大金矿,我们怎样去挖掘这个金矿呢?博云视觉CEO陈杰在2016云栖大会•北京峰会上分享了以图搜图的电商搜索新模式。

一张好图可以胜过千言

电商行业里面最重要的是什么呢?毫无疑问,是搜索带来的流量。图片可以通过冲击视觉让人们产生想要购买的欲望。我们怎样去挖掘图片这个金矿?博云视觉CEO陈杰在2016云栖大会•北京峰会上分享了博云视觉在过去几个月的时间里和阿里云的合作,以及博云视觉在电商图片搜索上的实践。

图像搜索应用成趋势

在数据量方面,视觉在人类获取信息途径上占到了80%以上的比重。随着现在手机拍照功能的强大和应用的普及,人类拥有的图像也构成了一个非常大的图像数据库。根据统计,截止到目前为止,人类通过拍照的方式产生的图片大约接近三万亿幅。在这样一个海量的数据中,怎样去挖掘图像本身的价值,进而在大数据中去搜索相关的信息是一个新的挑战。

8f35b96da3d9a90e806c7f878b17d9dd42afac55

从最新的CNNIC发布的关于中国网民的搜索行为的调查报告(截止到2015年12月份)来看,人们通过手机端搜索的方式主要有文字、二维码、条形码以及图像和语音的技术。传统的文字搜索已经被大家使用了很多年,占到了搜索的96%,而图像作为信息的入口级渠道,以图搜图这种交互模式已经逐渐被接受。文字、语音都是人们已经定义好的一种描述信息,而图像除了已定义的可描述信息,还蕴含多种描述困难的信息。

这也是各大互联网公司开始抢滩图像市场的重要原因,我们看到各大互联网公司已经陆续推出图像搜索的应用或者功能,例如:百度识图、拍立淘、微信扫一扫、拍照购等,视觉搜索带来的流量也逐步开始扩张市场份额。

电商图搜应用场景

随着移动互联网技术的发展,通常在移动购物场景中会面临到几种情况:

一,我们在看直播节目或者电视节目时,我们可能对网红的某些产品感兴趣,想了解是否有同款,这个时候就很难描述这个产品是什么,这时候我们就需要图片;

二,我们在实时场景中看到前面一个人背的包,感兴趣但是无法描述;

三,社交平台上分享信息的时候,微商分享某种商品需要去淘宝等其他平台上该商品的价格;

四,最近比较火的跨境电商业务,海外的商品语言描述看不懂,这个时候就有一些不对称的信息。

所见所得的新交互模式

这些场景下,无论我们用语言还是文字都很难直接对场景进行一个直观的描述。然而,最简单的方式是直接拍照,把内容信息上传到图像搜索引擎,通过数据库搜索,精准的匹配到想要获得的信息。这就是“所见即所得”的新型的交互方式。

f4cb918c9b686d0a5a9bab1b727c0b27d7819cb9

这种交互方式由三个部分包括:智能前端,包括一些手机以及未来的可穿戴设备如智能眼镜等;中间是一个移动网络,包括3G、4G、WiFi;云端连接着大型的云计算平台——阿里云,提供各项的数据服务。在传统的电商数据库里面,最核心的应用数据是文本数据,包括商品的价格、信息、介绍等,我们称之为结构化的数据。使用文本搜索时,会面临描述障碍、信息不对称等各种问题。再看另外一个维度,在云端的数据库上,除了文本数据还有更大量的电商图像数据,我们称之为非结构化的数据。其实,我们也可以把这些非结构化数据索引起来提供同样的“以图搜图”的方式,有了这样的索引数据库之后,在移动购物场景中,只要掏出手机对着感兴趣的商品进行拍摄,把图像内容发送到服务器端,在大规模的图像数据库中进行图像的比对搜索,那么最终就可以通过以图搜图的方式找到目标商品的相关信息。这种图搜技术有最核心的两个特征:

紧凑视觉特征表示。移动终端直接提取低比特、低复杂度、高准确率的紧凑视觉特征,并发送到服务端进行搜索。

高性能图像搜索。基于紧凑视觉特征,单幅图像索引所需数据仅需约4K;高效的海量特征索引算法,解决超大规模图像非结构化数据搜索难题。

那么,怎样从图像中提取紧凑视觉特征来让计算机能看懂这样一个图像?

紧凑视觉特征表示

f8befe3c84fcdcc1af9f56d13259bbea8fab9c13

给定一张图像,首先要做的是在这个图像中做一个兴趣点的检测。兴趣点是指根据人类的视觉机理去发现能够刺激视觉的一些底层视觉特征。紧接着把兴趣点描述成一个特征,这样就形成了一个最原始的底层视觉特征。之后,利用博云视觉自主研发技术把原始抽出来的特征压缩到很小,在经过一个熵编码的环节最终产生一个非常紧凑的描述一个图像的特征码流。

博云图搜基于图像特征的表达技术以及特征的索引技术,开放成标准化API服务。用户可以直接调用API服务来在各自的应用中实现以图搜图。

面向电商行业,博云图搜推出了电商的专项搜索解决方案。用户可以把自有的图像数据通过SDK上传到阿里云平台,然后结合弹性计算、CDN网络、OSS存储的基础上调用图像搜索SDK实现对图像数据本身的管理、搜索、增删改等应用。结合上层可以做边看边买、拍照购物等与图像搜索相关的电商应用。

同时针对移动终端,博云图搜推出了能够直接提取紧凑视觉特征、减少实际应用中大规模并发查找的带宽占用、流量占用的应用。

下面通过两个具体案例讲解图像搜索在电商搜索中是如何应用的。

蕾丝企业案例

f31e80b99fc7623806a541d6712a188b62f61665

该行业的痛点是:采购商无法准确描述所要的蕾丝款式;数以万计的蕾丝花型,销售人员多无法记住;蕾丝工厂大量库存无法与客户需求精确匹配。针对上述痛点,博云视觉的企业客户之一,推出了一个蕾丝采购平台,“蕾丝小姐“APP,用户可以直接拍照上传,发送到云端,在众多后端产品库中查找相同或相似的目标蕾丝花型。这个平台建立了百万级蕾丝花型数据库,搜索平均准确率在80%以上。打开APP之后,直接可以通过打开拍照的方式对感兴趣的布料进行拍照,通过快速比对的图像搜索技术就可以查到与布料相同款或者相似款的供应商信息,并且可以点击相应的供应商进行后续的沟通。

红酒搜索的案例

3a0e53954f7040e150240257b6106003c4115295

用户可以拍摄葡萄酒瓶上的酒标,通过“以图搜图”直接获取相关信息。葡萄酒标图像识别准确率95%以上 。“酒靠谱”APP集成了百万量级葡萄酒数据,这些数据都在数据库端,我们可以直接拍照,然后发送紧凑视觉特征到云端进行搜索,这样我们就可以快速匹配出酒的款型、相应的酒标信息、评论信息、价格信息。具体的实际操作过程与上一个案例类似,这里不再赘述。

 

本文根据博云视觉CEO陈杰在2016云栖大会•北京峰会上的演讲整理而成。
相关文章
|
存储 JavaScript 开发者
探索鸿蒙新世界:ArkUI框架实战指南,解锁HarmonyOS应用UI设计的无限可能!
【10月更文挑战第19天】ArkUI框架是华为鸿蒙系统中用于开发用户界面的核心工具,支持ArkTS和eTS两种开发语言。本文介绍了ArkUI的基本概念、组件使用、布局管理和状态管理,通过示例代码帮助开发者轻松构建美观、高效的跨设备UI。
1039 3
采用zookeeper的EPHEMERAL节点机制实现服务集群的陷阱
在集群管理中使用Zookeeper的EPHEMERAL节点机制存在很多的陷阱,毛估估,第一次使用zk来实现集群管理的人应该有80%以上会掉坑,有些坑比较隐蔽,在网络问题或者异常的场景时才会出现,可能很长一段时间才会暴露出来。
14852 1
|
消息中间件 Java 应用服务中间件
Kafka配置公网访问,直接暴露方式与nginx代理方式(绝对没问题)
Kafka配置公网访问,直接暴露方式与nginx代理方式(绝对没问题)
5854 1
|
7月前
|
文字识别 程序员 UED
Python + 腾讯云,多页PDF发票识别一键搞定!
程序员晚枫团队推出了基于Python和腾讯云的多页PDF发票识别功能!通过一行代码即可实现整本PDF发票的高效识别,并直接导出为Excel文件,极大提升工作效率。此次更新修复了仅识别第一页的bug,支持多页PDF完整识别。未来还将拓展更多票据类型、优化速度并加强平台合作。欢迎用户体验并提出建议,共同推动开源项目poocr的成长与进化!
247 7
|
安全 搜索推荐 开发者
XYNTService 报错 StartServiceCtrlDispatcher Failed, error code = 1063
【10月更文挑战第7天】XYNTService 报错 StartServiceCtrlDispatcher Failed, error code = 1063
321 6
|
Kubernetes 容器
Kubernetes附加组件Dashboard部署实战篇
关于如何在Kubernetes集群中部署和配置Dashboard组件的详细实战指南,涵盖了从创建证书、部署Dashboard、设置服务访问到登录认证的完整流程。
1411 0
Kubernetes附加组件Dashboard部署实战篇
|
Android开发
Android面试高频知识点(1) 图解 Android 事件分发机制
在Android开发中,事件分发机制是一块Android比较重要的知识体系,了解并熟悉整套的分发机制有助于更好的分析各种点击滑动失效问题,更好去扩展控件的事件功能和开发自定义控件,同时事件分发机制也是Android面试必问考点之一,如果你能把下面的一些事件分发图当场画出来肯定加分不少。废话不多说,总结一句:事件分发机制很重要。
431 9
|
XML 监控 API
淘宝商品详情数据接口全攻略:如何高效获取与分析商品信息
【淘宝商品详情数据接口全攻略】:注册开发者账号,申请API权限,构建HTTP请求获取商品信息,包括基础属性、价格等。遵循规则,处理并分析数据,用于竞品分析、价格监控和用户行为洞察。利用接口高效获取数据,助力电商决策。#淘宝API #数据分析
|
传感器 人工智能 供应链
未来科技发展趋势及其对社会的影响
【2月更文挑战第7天】本文探讨了未来科技发展的趋势,并分析了这些趋势对社会的影响。从人工智能、物联网、区块链到生物技术等多个领域展开讨论,旨在帮助读者了解未来科技的前沿动态以及应对社会变革的挑战。
|
机器学习/深度学习 自然语言处理 数据挖掘
全球最长开源大模型!元象开源 XVERSE-Long-256K!(附魔搭社区推理微调最佳实践)
近日,元象发布全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K,支持输入25万汉字,让大模型应用进入“长文本时代”。该模型全开源,无条件免费商用,目前魔搭社区可下载体验。