智能驾驶系统是怎样看懂交通标志的?3张流程图给你讲明白

简介: 导读:自然场景中交通标志牌图像识别的关键技术主要分为检测和识别两大类。其中,为了对目标图像进行准确识别,标志牌感兴趣区域的检测是首先要解决的问题。

云栖号资讯:【点击查看更多行业资讯
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

导读:自然场景中交通标志牌图像识别的关键技术主要分为检测和识别两大类。其中,为了对目标图像进行准确识别,标志牌感兴趣区域的检测是首先要解决的问题。近年来,交通标志牌检测技术已经成为智能驾驶公交车辆视觉导航系统和计算机视觉领域的热点之一[1-2]。

本文将探讨基于视觉协同显著性的交通标志牌检测框架设计。

95587407_4835_4f5a_8D82_F952BA617642

大多数传统的交通标志牌检测算法常常是基于任务驱动的,如依赖颜色、形状以及机器学习。目前,这些算法针对的应用场景往往局限于结构化或半结构的环境,如高速公路等。

如今,随着生物神经元的发展以及大脑视觉皮层中信息处理机制的揭示,基于选择性注意机制的视觉显著性目标检测逐渐引起人们的关注[3-5]。

正如我们所知道的,人类在对一幅场景图像进行观察时,会毫不费力地将注意力聚焦在特定的目标或区域上。而这些目标或区域经常具有显著的视觉特征,如边缘轮廓、细节纹理、梯度方向、颜色强度以及空间位置等。

受此启发,本文提出一种基于视觉协同显著性的交通标志牌检测算法,这是目前较有前景的解决办法。

协同显著性的目标是从多幅输入图像中提取共同的显著性前景目标[6-7]。在本章主要面向复杂场景中的多幅交通标志牌图像进行检测。其中,为满足协同显著性检测,输入图像需要满足以下两个要求:

遵循人类视觉感知机制,单幅图像中可视化的目标区域能够明显与背景区分开来;
多幅图像中的协同显著性目标彼此具有相似性。

研究一种复杂场景中基于视觉协同显著性的交通标志牌检测算法,总体框架如图2-1所示。其检测过程涉及两个阶段:

在第一阶段,构建一个基于聚类的协同显著性模型,旨在检测多图像中重复出现的同一或近似的视觉显著性物体,其结果由协同显著图获得。其中,协同显著图由图间显著图和图内显著图融合而成。本阶段是一种bottom-up(自底向上)的视觉处理过程,根据图像底层特征分割出区别度最大的显著性目标。

在第二阶段,一个top-down(自顶向下)的几何结构约束模型被提出。目的是对检测出的显著性目标做自顶向下的几何结构约束分析,从而准确定位交通标志牌的ROI区域。

AD43502D_44C8_4e62_9C69_A63CE4BF50B3

01 基于聚类的图间/图内显著性检测模型子框架

构建基于聚类的协同显著性模型以得到协同显著图。其中关键是通过聚类进行图间关联性约束分析和图内关联性约束分析,使之分别生成图间协同显著图和图内显著图,其框架设计如图2-2所示。

E7573887_AF6A_4738_9710_DAA4579643AC

依据bottom-up视觉注意力线索—分别为对比度线索、中心偏移度线索和对称性线索,对输入图像集进行聚类级别的显著性度量。将3个视觉注意力线索权值进行高斯归一化处理后,利用乘积融合为整体显著性图。最后采用概率框架软分配的方式平滑每个像素的显著性测度值,得到聚类级的图间/图内显著图。

采用的聚类算法为Kmeans++,这是一种无监督聚类算法,可以直观地划分出图像内与图像间的关联性区域。需要注意,聚类个数的选取是人为设定的。本文凭借实验对象和实验效果对聚类数目设置经验值,其中单幅图像内的聚类个数为6,多幅图像间的聚类个数为,其中,M表示输入图像的数目。

图2-3分别提供了单幅图像内的聚类和多幅图像间的聚类效果,可以看出Kmeans++实现了图像内的局部不变性约束和图像间的全局一致性约束。

22D0BCAD_02BD_42e5_9133_723F42DA306C

02 几何结构约束模型子框架

总体上说,单纯依靠自底向上的显著性线索虽然能够将显著目标突显出来,但却很难移除一些干扰物的影响。这是由于在第一阶段寻找区别度最大的显著性区域或目标进行简单融合计算时,这些干扰物往往也会被赋予较高的显著度,从而对后续分析造成极大干扰。

人类的视觉系统对事物的感知是一个和外界环境交互的过程,既和自底向上数据驱动有关,也和自顶向下任务驱动有关。

因此,构建了一种几何结构约束模型,对检测出的交通标志牌协同显著图作自顶向下的几何约束。本文主要对日常生活中应用最广泛的圆形和三角形交通标志牌进行研究。即通过圆度和三角形检测模型判别每个场景目标所属类别,最后定位含有标志牌的ROI区域,如图2-4所示。

FCD3E387_44A2_4fea_9D1C_8A3E38863002

关于作者:余伶俐,中南大学人工智能系副教授,主持多项国家重点研发计划子任务、湖南省科技重大专项子课题、国家自然科学基金等项目。承担了两期的中车时代电动汽车“智能驾驶决策与控制系统”开发,在湖南湘江新区与智慧公交示范运营线路上完成了3500 km测试,获得了湖南省颁发的第一辆智能驾驶公交车牌照。

周开军,湖南工商大学教授、硕士生导师,美国布兰戴斯大学国家复杂系统研究中心访问学者,湖南省青年骨干教师,湖南工商大学151人才。

陈白帆,中南大学副教授,硕士生导师,湖南省人工智能学会副秘书长,湖南省自兴人工智能研究院副院长,长期从事智能驾驶、移动机器人等应用理论研究。先后主持国家自然科学基金项目、湖南省自然科学基金项目,参与国家自然科学基金重大计划、国家重点研发计划、湖南省科技重大专项子课题。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/zhibo

立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

原文发布时间:2020-06-03
本文作者:余伶俐 周开军 陈白帆
本文来自:“大数据DT 微信公众号”,了解相关信息可以关注“大数据DT

相关文章
|
机器学习/深度学习 监控 安全
人脸识别技术:身份验证的新选择
在数字化时代,随着数据安全和个人隐私保护日益受到重视,传统的身份验证方式也已经不能满足现代社会对安全性和便捷性的需求。而人脸识别技术应运而生,它的高精度和快速识别能力使得它成为了一种备受关注的身份验证方式。本文将从人脸识别技术的发展历程、应用场景以及优缺点等方面进行探讨。
549 3
第十一章 Android Gradle多渠道构建
因为我们发布或者推广的渠道不同,就造成了我们的Android App可能会有很多个,因为我们需要细分他们,才能针对不同的渠道做不同的处理,比如统计跟踪、是否升级、App名字是否一致等等。尤其在国内这个各种应用市场百家争鸣的时代,我们需要发布的App渠道甚至多个好几百个,而且各有各的特殊处理,所以这就更需要我们有一套自动的满足多渠道构建的工具来帮我们解决这个问题,有了Android Gradle的Flavor后,我们就可以完美的解决以上问题,并且可以实现批量自动化。这一章主要介绍多渠道构建的基本原理,然后使用Flurry和友盟这两个最常用的分析统计平台作为例子来演示多渠道构建,接着我们介绍下Fl
570 0
第十一章 Android Gradle多渠道构建
|
存储 Java Spring
SpringBoot是如何实现自动配置的?--SpringBoot源码(四)
SpringBoot是如何实现自动配置的?--SpringBoot源码(四)
1080 0
|
8天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
2715 14
|
5天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
2197 4
|
21天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23553 13
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
8天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2003 1
|
2天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
1227 1
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek