2021国际计算机视觉挑战赛,我们赢了三个奖!

简介: 计算机视觉方向的三大顶级会议ICCV组织的Visual Inductive Priors(简称VIPriors)比赛,这个大赛里目标重识别这个赛道的最高成绩是97%(识别精度)。来自蚂蚁集团保险技术团队的参赛选手拿到了第三名的成绩(94%)。

先来做个题。


下面两张图里的狗狗是同一只狗狗么?

 

截屏2021-11-19 下午5.26.08.png


答案:是的。


这个题考的是:宠物身份验证。可以用眼,当然你得是宠物的主人才可能很肯定说出两只狗狗的细微区别。


还有一招:可以借助“目标重识别”技术。这是一项视觉识别技术里的基础技术能力。


这个技术领域里刚刚举行了一个世界级大赛:计算机视觉方向的三大顶级会议ICCV组织的Visual Inductive Priors(简称VIPriors)比赛,这个大赛里目标重识别这个赛道的最高成绩是97%(识别精度)。来自蚂蚁集团保险技术团队的参赛选手拿到了第三名的成绩(94%)。


物体识别是计算机视觉领域中的一项基础研究,它的任务是识别出图像中有什么物体,并报告出这个物体在图像表示的场景中的位置和方向。目前物体识别方法可以归为两类:基于模型的或者基于上下文识别的方法,二维物体识别或者三维物体识别方法。对于物体识别方法的评价标准,Grimson 总结出了大多数研究者主要认可的 4 个标准:健壮性(robustness)、正确性(correctness)、效率(efficiency)和范围(scope)。


在VIPriors的这个比赛里,物体图片识别还有一个赛道:图像实例分割。该团队参赛选手赢得了第二名的成绩。


目标重识别和图像实例分割都属于图片物体识别技术里的基础科学,能够有效解决场景中对物体的识别需求。


譬如在核保和报销中,图像实例分割可用于保险理赔场景下非规则形状的文字提取。像下图中电子票据中电子章的文字区域提取。

 

截屏2021-11-19 下午5.26.23.png

 

除了图片识别和分割的比赛,今年ICCV还组织了Occluded Video Instance Segmentation(简称OVIS,遮挡视频实例分割”)比赛。


OVIS比赛比的是:视频里存在大量多种多样物体之间的遮挡,要求算法能检测、分割、跟踪视频里所有的物体。


遮挡视频实例分割是一项需要同时对视频中感兴趣的对象实例进行分类、分割和跟踪的任务。可用于宠物社区宠物视频拍摄,和人宠互动视频拍摄。


这个比赛,蚂蚁集团保险技术团队的参赛选手获得第一名!


截屏2021-11-19 下午5.26.36.png

第一名的奖状长这样。


截屏2021-11-19 下午5.27.03.png


实例分割是计算机视觉中的基础问题之一。


目前,静态图像中的实例分割业界已经进行了很多的研究,但是对(遮挡)视频的实例分割的研究相对较少。而真实世界中的摄像头所接收的,无论是自动驾驶背景下车辆实时感知的周围场景,网络媒体中的长短视频,还是智能理赔流程中的凭证识别,大多数都是视频流信息而非纯图像信息。因而研究视频理解的模型有着十分重要的意义。


基于视频级别的实例分割技术相比图像级别,其优点在于可以充分利用物体跨帧的连续性和时态上下文线索,但同时也对计算资源提出更高要求。


遮挡视频实例分割是2019年由业内学者提出的新任务,自提出起便得到了Facebook、字节跳动、腾讯等国内外公司的关注,目前该领域还处于发展初级阶段。


该技术在视频流中的理赔凭证理解、电商险理赔商品识别,视频面访,宠物身份识别等保险场景中起到作用。蚂蚁保险推出的智能理赔服务可以利用该技术处理上述复杂场景。


目前,遮挡视频实例分割技术已经应用于蚂蚁保险的智能理赔场景中,大大提升理赔效率和准确率。


例如,利用该技术可以更便捷的识别视频流中的理赔凭证,从一摞纸中把最上面的凭证主体切割提取出来(图1)。


此外,以宠物险为例,除了利用鼻纹识别技术识别宠物之外,如下面视频中的四张图(图2)所示,算法模型可以将相互遮挡的三只猫体准确分割,从而进行就更精准的动物身份识别。


该技术未来在企业贷款的凭证上传,自动驾驶的场景理解,短视频或直播中的人物背景分离等应用场景也会有广泛的应用价值。

 

 截屏2021-11-19 下午5.27.13.png

(图1:理赔凭证切割)


截屏2021-11-19 下午5.27.24.png

(图2:遮挡宠物分割)

相关文章
|
Kubernetes 安全 持续交付
「译文」什么是 Terraform?
「译文」什么是 Terraform?
|
自然语言处理 JavaScript 前端开发
|
4月前
|
Rust 安全 测试技术
智能合约开发语言对比与选择
本文系统构建智能合约语言对比框架,涵盖安全性、成本、生态等维度,提出加权评分模型与结构化分析方法,对比Solidity、Vyper、Move、Rust、Cadence等语言特性,结合团队能力与业务场景,提供量化选型指引。(238字)
|
Cloud Native Dubbo 应用服务中间件
阿里巴巴捐献的14个顶级开源项目,国内开源贡献第一!
代表性的项目包括龙蜥操作系统、Apache RocketMQ、Apache Dubbo、Spring Cloud Alibaba 等
|
8月前
|
存储 关系型数据库 BI
如何开发ERP系统中的财务管理板块(附架构图+流程图+代码参考)
本文深入解析ERP系统中财务管理模块的设计与实现,涵盖核心功能、业务流程、开发技巧及代码示例,助力企业打造高效、智能的财务管理系统。
|
自动驾驶 物联网 5G
深入探索5G网络中的网络切片技术及其应用场景
深入探索5G网络中的网络切片技术及其应用场景
4074 3
|
存储 缓存 关系型数据库
【MySQL进阶篇】存储引擎(MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案)
MySQL的存储引擎是其核心组件之一,负责数据的存储、索引和检索。不同的存储引擎具有不同的功能和特性,可以根据业务需求 选择合适的引擎。本文详细介绍了MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案。
2208 57
【MySQL进阶篇】存储引擎(MySQL体系结构、InnoDB、MyISAM、Memory区别及特点、存储引擎的选择方案)
|
SQL 运维 分布式计算
Dataphin离线数据开发规范
目前,用户在Dataphin上进行数据开发时,风格各异,缺乏一致性。为此,我们整理了一份开发规范文档,旨在帮助所有用户实现更高效和一致的开发流程。
550 4
|
JSON JavaScript 开发工具
NPM 使用介绍
10月更文挑战第2天
827 0
|
存储 分布式计算 大数据
MaxCompute 数据分区与生命周期管理
【8月更文第31天】随着大数据分析需求的增长,如何高效地管理和组织数据变得至关重要。阿里云的 MaxCompute(原名 ODPS)是一个专为海量数据设计的计算服务,它提供了丰富的功能来帮助用户管理和优化数据。本文将重点讨论 MaxCompute 中的数据分区策略和生命周期管理方法,并通过具体的代码示例来展示如何实施这些策略。
1154 1

热门文章

最新文章