详解阿里99大促活动页内容识别技术实现

本文涉及的产品
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频通用资源包5000点
视觉智能开放平台,图像通用资源包5000点
简介: 精准!

闲鱼技术-仝辉,深宇

引言:

      淘宝99大促今年会有天猫,淘宝和聚划算全员参与,有上千个页面形式的展现。其中,测试是保障活动页面的正常发布的一个必不可少的关键环节。

      传统的测试方法,需要测试人员去分析这个页面是否正常生成,以及是否实现正常地跳转等。这样通常会占用大量的测试资源。那么能否利用机器学习等相关技术为测试赋能呢?

      带着这个问题,我们分析了页面的特性。经过分析后发现页面具有高度的相似性,很多模块是复用的。因此,可以利用机器学习去学习模块特征,进而达到识别这些模块的目的。最终,我们实现了对淘宝99大促几十个活动页模块的自动识别。

      具体的模型训练和模型识别部分会在下一章节“处理流程”中详细介绍。

处理流程:

      深度学习技术通常由两部分构成:模型训练和模型预测。

      深度学习通常是有监督学习的方式,因此在模型训练环节中,需要输入训练样本,“告知”它输入和输出是什么。此外,我们还需要选择合适的深度学习网络来训练。相关细节会在后续两个小节中详细描述:

样本生成:样本生成过程中使用的三种方法
模型选择:fpn + Cascade R-CNN

      在模型预测环节,由于页面内容理解部分不止需要识别模块,还需要识别模块内部的元素。此外,受限于目标检测模型本身的局限性,会导致识别出来的位置没法达到像素级别的精确性,因此需要对位置做修正。为了近一步提高准确度,本文引入了位置修正模块。因此,本文的模型预测分为如下三个部分做介绍:

模块识别:识别页面中模块类别和位置
元素识别:基于模块的识别区域,识别内部元素
位置修正:通过传统图像的方式修正内部元素位置

模型训练:

样本制造:

      样本制造我们演进了三个版本:

image.png

      第一个版本是手动打标,基于labelImg等标注工具进行标注。这种打标方式的缺点是需要投入较多的人力资源,且无法满足未上线页面的打标。

      第二个版本是模型辅助打标,也就是先训练一个初始可用的模型,然后利用模型预测结果对模型进行初始标注,对不正确的地方作修改,可以不断地迭代优化模型。这种打标方式的缺点是无法满足未上线页面的打标。

      第三个版本是自动打标,分析H5页面的代码生成布局DSL,然后通过替换属性的方式自动生成相关代码。这种打标方式的优点是可以解决上述两个版本中“无法满足未上线页面打标”的问题。这种方法也是本文中采用的主要方法。

      本文,主要使用了第三种方式去生成训练数据,第一种和第二种更加真实的方式生成验证数据,达到生产环境准确验证的目的。

模型选择:

      淘宝99大促活动页需要识别活动页里面有哪些页面模块,且需要知道模块所在的位置。而深度学习的目标检测模型可以在给定的图片中精确找到物体所在位置,并标注出物体的类别。

      考虑到对坐标位置和类别有很高的召回率和准确率的要求(IOU0.5:0.95的召回率和准确率都要达到95%以上),本文使用了精度更高的Cascade-RCNN网络。

image.png

      主流的目标检测模型Faster-RCNN的缺点是RPN的proposals大部分质量不高,IOU低阈值会导致很多误检出,而高阈值会导致召回率过低。针对这个问题,Cascade-RCNN使用cascade回归作为一种重采样的机制,逐层提高proposal的IoU值,从而使得前一层重新采样过的proposals能够适应下一层的更高阈值。这样做的好处是:每个阶段都有不同的IoU阈值,可以更好地去除离群点,适应新的proposal分布。

      针对识别模块大小不一这种情况,我们在卷积特征提取网络加入了特征金字塔结构,均衡了不同尺度模块的检出数量(对小模块提升尤为明显),进而提高了召回率和准确率。网络结构如下图所示:

image.png

模型识别:

模块识别:

在本期的淘宝99大促中,我们支持了28个模块的识别,类似的模块如下:

image.png
image.png
识别的结果如下所示:
image.png
image.png

元素识别:

      由于页面内容理解部分不止需要识别模块,还需要识别模块内部的元素。如下图所示,我们不仅要识别七巧板模块,也需要识别内部元素的会场导航和商品导航模块。

image.png
      本文考虑到这两种元素也会在页面中单独出现,采用了Coarse-to-Fine的架构:首先识别七巧板模块,然后通过另一个目标检测网络去识别内部元素。
image.png

      识别的最终结果如下图所示:
image.png

位置修正:

      由于目标检测模型本身的局限性,会导致没法达到像素级别的精确性,因此需要对位置做修正。为了近一步提高准确度,采用计算公式如下:

image.png
image.png

现有效果

      本篇我们基于FPN+Cascade网络去预测淘宝99大促模块,在验证集近千张的样本量的情况下,采用了coco的验证标准,达到了如下的准确率:

      Average Precision (AP) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.982

      Average Precision (AP) @[ IoU=0.50 | area= all | maxDets=100 ] = 0.989

      Average Precision (AP) @[ IoU=0.75 | area= all | maxDets=100 ] = 0.984

      Average Precision (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.989

      Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 1 ] = 0.423

      Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets= 10 ] = 0.986

      Average Recall (AR) @[ IoU=0.50:0.95 | area= all | maxDets=100 ] = 0.993

      Average Recall (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.993

      Average Recall (AR) @[ IoU=0.50 | area= large | maxDets=100 ] = 1.000

      由上面的数据我们可以知道,页面和相应元素识别的召回率和准确率达到了98%左右,满足了识别精度的要求。此外,该流程符合Coarse-to-Fine的架构(由粗粒度到细粒度),对于相类似的问题也可以采用该方法处理。

未来展望

      我们后续会尝试将本文的方法推广应用到更多的业务场景中去,例如双十一活动页模块识别等。由于本文的方法相对耗时(GPU机器几百毫秒级别),后续会在效果和效率的均衡上作更多的尝试。也希望大家能够关注我们后续的系列文章。

相关文章
|
3月前
|
搜索推荐 数据挖掘 API
阿里巴巴API接口对电商的影响与收益
在全球电子商务快速发展的背景下,阿里巴巴作为领先的B2B平台,为中小企业提供商品批发、分销、供应链管理等一站式服务,并通过开放的API接口为开发者和电商企业提供数据资源与功能支持。本文将深入解析阿里巴巴API接口的功能(如商品搜索、详情、订单和用户管理)、应用(如商品展示、搜索优化、交易管理和用户行为分析)、收益(如流量增长、销售提升、库存优化)及实际案例,附带代码示例,助力电商从业者提升运营效率和用户体验。
189 0
|
11月前
|
人工智能
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
【2月更文挑战第15天】阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
855 2
阿里上线AI电商工具“绘蛙”,让你的商品第一时间被种草
|
算法 安全
图文创作者的新机会,微信公众号有了新的增长入口
图文创作者的新机会,微信公众号有了新的增长入口
133 0
|
移动开发 缓存 搜索推荐
淘宝首页大促新玩法“猫头”背后的技术挑战和设计
本文详细介绍了淘宝首页大促新玩法“首页即会场”项目,从开放模式、复用粒度、交互实现、性能、可扩展性等技术角度来说明“猫头”是怎样炼成的。
451 0
|
双11 UED
《双十一电商行业 网站用户体验报告》电子版地址
电商行业的关注点逐渐从追求增长速度转向关注更加顺畅的用户体验与更加优质的服务质量。面对全球化营销以及大促带来的流量浪涌,如何应对散布在全球不同地区与国家的海量用户,及时发现流量激增带来的用户体验与性能问题,成为每个电商乃至众多互联网企业需要关心的重点。
125 0
《双十一电商行业 网站用户体验报告》电子版地址
|
算法 搜索推荐 数据可视化
阿里拍卖全链路导购策略首次揭秘
拍卖,是一个大家熟悉的词汇,但对在线拍卖以及在线拍卖的个性化推荐,大家可能不那么熟悉。本文将对阿里拍卖业务背景先做介绍,进而描述业务中的浅库存约束及拍品冷启动问题,并分别提出经线上AB实验验证的解法,最后是对解法适用范围的讨论。
|
编解码 双11 UED
猫晚流量再创记录,阿里云直播方案护航优酷2500万用户体验
对“剁手党而言,天猫双11早已经超越了简单的“买买买”,更是一场边看边玩的狂欢盛宴。今年的天猫双11狂欢夜晚会(简称“猫晚”)在上海举办,这台兼具年轻潮流与国际风范的“超级晚会”,通过优酷、浙江卫视、东方卫视进行了全程网络直播和电视直播,吸引了超过全球超过2.4亿人收看。
2476 0
猫晚流量再创记录,阿里云直播方案护航优酷2500万用户体验
|
云安全 边缘计算 运维
2020双十一终极清单!阿里云CDN&视频云最全优惠攻略
为了答谢新老用户,CDN&视频云火力全开,特此推出新用户5折起、爆款产品低至5.6折、全线预付费产品低至7折钜惠等优惠活动,帮助大家降低上云门槛。
3127 0
2020双十一终极清单!阿里云CDN&视频云最全优惠攻略
|
UED
买CDN&视频云都不会错过的活动——618大促产品专家带你边看边买
2020年阿里云全速重构亿元补贴618上云年中促火热进行中,CDN和视频云产品低至5.5折,并有产品专家直播解读全站加速、直播与点播产品,带你边看边买,点击阅读详情。
742 0
买CDN&视频云都不会错过的活动——618大促产品专家带你边看边买