车辆行为识别应用现状

简介: 近年来,随着汽车行业的日益更新和人工智能的快速发展,无人驾驶技术受到广泛的推广和应用。无人驾驶的环境感知是实现车辆安全有效驾驶的必备技术,通过车载摄像头记录车辆周围视觉环境数据,识别出周围车辆和障碍物的信息从而执行相应操作。

     近年来,随着人工智能的发展和城市交通系统的完善,基于视频的车辆行为识别成为一个全新的命题进入人们的视野。车辆行为识别可以作为辅助技术应用到无人驾驶领域和交通监控场景中,使用范围广泛。目前在车辆识别领域的研究中,主要的研究对象为交通系统中的车辆,按照不同的视频场景可以分为两大类,一类是动态背景下的车辆行为识别,如下图(a)所示,识别数据主要来自于行车记录仪,根据车载摄像头记录的视频内容,判断周围环境中其他车辆与当前车量的相对位置,进而指导当前车辆做出动作,主要用于驾驶行为决策。另一类是静态背景下的车辆行为识别,识别数据主要来自道路上固定摄像头下的监控画面,如下图(b)所示,这类车辆行为识别方法会结合轨迹或场景进行分析,主要判断车辆是否违反交规,或通过大数据来进行交通系统的安全分析。

]2@I%JB3C@OLF}2~[~BXFW5.png

      对于施工场景中的工程车辆行为识别问题,由于工程车辆种类繁多,动作模式各不相同,难以有统一的标准,因此目前这方面的研究较少。除此之外,在视频行为识别领域的方法大都基于完整的 RGB 图像,一个视频数据只能推理出一个动作类别。但对于所讨论的工程监控场景中,视频中经常会出现多类工程车辆,因此需要借助目标检测和多目标跟踪方法。传统目标检测算法主要包括 3 个步骤,首先通过滑动窗口提取先验框,其次针对先验框进行特征提取和特征选择,最后对选择到的特征进行分类。在这种方法中,滑动窗口的大小和滑动策略会影响特征提取质量。针对这种传统算法精度低的问题,Girshick 等人首次提出将基于区域的卷积网络(Region Based Convolutional Neural Network,R-CNN)应用于目标检测中,R-CNN 使得 VOC2007 数据集上的检测精度(Mean Average Precision,mAP)从 29.2%提升到 66.0%。在这之后 R-CNN 系列的到了长足发展,精度也得到了进一步提高,由于 R-CNN 这样的两阶段检测器需要在检测前生成大量待检测的候选区域(Region Proposal),因此在速度上具有一定劣势。而之后出现的单阶检测器解决了这一问题,如 SSD(Single Shot MultiBox Detector)和 YOLO(You Only Look Once)系列,无需像 R-CNN 系列那样生成候选框就能进行直接的图像分类和边框回归,更加高效快速。各类目标检测算法在不断发展中速度和精度也在不断提高,逐渐在智能监控、机器人行为控制、航天航空等领域得到了广泛应用。

      针对高后果区油气管线巡检中的安全问题,我国也研究出了一些新的应对方案。如通过智能管理系统在网络端统一管理,或通过机器人巡检等方案来提高管线安全性,而针对巡检过程中工程车施工安全问题的研究尚少。

相关文章
|
人工智能 架构师 云计算
阿里云×典名科技首场城市服务商招募会落地西安
9月20日,“阿里云×典名科技城市服务商招募会”在西安隆重召开,会上发布了城市服务商伙伴业务支持计划。该计划旨在深度宣传和落地“伙伴优先”战略,吸纳更多优秀合作伙伴加入阿里云生态。
|
缓存 Java API
JVM 四种引用和使用场景
在JDK 1.2之后,Java对引用的概念进行了扩充,将引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)四种,Java 4种引用的级别由高到低依次为:强引用 > 软引用 > 弱引用 > 虚引用。
369 0
|
Ubuntu 安全 Linux
盘点|2021年最受欢迎Linux桌面操作系统前十名
根据各操作系统镜像站后台下载量,阿里云镜像站统计了2021年最受欢迎的Linux桌面操作系统,仅根据调用量排名,供大家参考。排位最高的还是Centos,受中国Linux用户欢迎的Ubuntu、Debian均进入了前十,国内的优麒麟操作系统排在第7位。
12635 3
|
9月前
|
安全 生物认证 网络安全
windows10无法设置默认保存位置怎么办?显示错误代码0x80070002怎么解决?
Win10系统下载文件时,默认会保存在特定位置,但用户可自行修改。若更改后仍无效,可通过删除目标磁盘中的特定文件夹、修改注册表权限、“干净启动”排除干扰软件或使用第三方修复工具等方式解决此问题。
1498 0
|
11月前
|
XML 自然语言处理 文字识别
SmolDocling技术解析:2.56亿参数胜过70亿参数的轻量级文档处理模型
SmolDocling是由HuggingFace与IBM联合研发的超紧凑视觉模型,专为端到端文档转换设计。基于SmolVLM-256M开发,参数量仅2.56亿,却媲美大型模型性能。其核心创新在于DocTags格式,一种类XML标记语言,能全面表示文档内容与结构。SmolDocling通过端到端架构实现图像理解与文本生成整合,在文档分类、OCR、布局分析等任务中表现出色。评估显示,其在多项指标上优于大参数量模型,适用于资源受限场景,推动文档处理技术发展。
253 8
SmolDocling技术解析:2.56亿参数胜过70亿参数的轻量级文档处理模型
使用Netty实现文件传输的HTTP服务器和客户端
本文通过详细的代码示例,展示了如何使用Netty框架实现一个文件传输的HTTP服务器和客户端,包括服务端的文件处理和客户端的文件请求与接收。
440 1
使用Netty实现文件传输的HTTP服务器和客户端
|
安全 网络协议 网络安全
端口转发:解锁网络访问的新维度
端口转发技术,简化网络数据流,用于家庭至企业服务器场景。它隐藏内部网络服务,提供远程访问、个人网站公开、NAT穿透及安全的VPN连接。设置涉及路由器管理界面,添加转发规则,但需注意安全风险,仅开放必要端口并加强内部安全措施。了解和善用端口转发,提升网络服务可达性与安全性。
1284 5
|
存储 监控 虚拟化
Hyper-V系统后装,实用技巧
在Hyper-V上进行系统后装时,掌握实用技巧至关重要。首先,确保硬件兼容并启用Hyper-V功能,准备操作系统镜像。接着,创建虚拟机时选择合适的版本,合理配置内存、存储和网络连接。安装操作系统后,优化性能,如安装集成服务、启用增强会话模式及动态内存。日常管理中,使用Hyper-V管理器监控性能、定期更新备份,并注意兼容性与安全性。这些技巧将显著提升安装效率与虚拟机性能。
|
机器学习/深度学习 数据采集 人工智能
基于Qwen 2.5的世界科学智能大赛冠军方案
本方案基于通义千问模型,采用多阶段的Easy-to-Hard数据合成方法,模拟人类学习的由简单到困难的思路,逐阶段构造多样化的训练数据。数据生成阶段,训练数据的标签,引入了“Chain-of-Thought”思维链模式,生成多样化的推理路径,逐步对齐推理Scaling Law。训练阶段,采用了LoRA对通义千问32B模型在合成数据集上进行参数高效微调。推理阶段,使用了4bit低精度量化,并结合vLLM框架进行推理加速,最终达到准确性、效率和显存利用率的统一。
1082 2
基于Qwen 2.5的世界科学智能大赛冠军方案
|
传感器 测试技术 芯片
在硬件连接时,如何确定 GPIO 引脚的功能和编号
在硬件连接中,确定GPIO引脚的功能和编号需查阅相关芯片或开发板的官方文档,了解引脚布局图,确认引脚的具体功能和编号,以确保正确连接和编程。
1298 3