基于深度学习的鱼眼图像中的停车位识别和分类（毕业设计+代码）

2023-05-10 214

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 基于深度学习的鱼眼图像中的停车位识别和分类（毕业设计+代码）

概述

基于深度学习的鱼眼图像中的停车点检测和分类是为二维物体检测而开发的。我们的工作增强了预测关键点和方框的能力。这在许多场景中很有用，因为对象不能用右上的矩形“紧密”表示。一个这样的例子，道路上的任何标记，由于透视效果，在现实世界中的对象矩形不会在图像中保持矩形，所以关键点检测显得格外重要。鱼眼图像还呈现了观察到这种现象的另一种场景，由于鱼眼宽广的视角，可以扑捉更多画像。

602d567de891d25977362cdb67aaa1f3_5dbe75cfa54448318b77a7d92d654977.png

预知结果

859dfdf354167b46f4a3bc91dab002ad_77d32555e47d4c7ea60f33122776cefe.png

上面的例子显示了一个停车位，它不能用直立的矩形（黄色）来表示。由4个关键点（蓝色）包围的形状表示它更符合要求。

算法过程

在自动驾驶（AD）应用领域中，自动代客泊车（AVP）在机会和采用方面尤其具有吸引力。摄像机是AVP应用中常用的感知传感器之一。在摄像机馈送中，停车点的检测和分类为空闲或占用是关键的。

停车点检测功能在自主操作期间用于定位和操纵到适当的停车位置。停车点检测的主要挑战在于在图像域中将停车点表现为梯形。此外，用于环绕视野或泊车辅助功能的现代相机往往是鱼眼，其中镜头失真会导致现实生活中的直线段和物体看起来弯曲。

提出了一种基于深度学习中对象检测框架的高效像素级停车点实例化和分类方法。该方法使用MobileNet-V1网络架构作为主干卷积神经网络（CNN），并使用改进的单镜头检测器（SSD）作为对象检测元架构，以直接在鱼眼域中执行停车点实例化。

物体检测功能的传统SSD元架构已经创新性地增强，以检测停车点的主要关键点，从而精确地描绘停车点边界。所提出的解决方案对于检测到的包围停车点的矩形盒实**现了0.87mAP，**并且每次检测的四个角点的精度为0.76OKS。

数据集

开发了名为TI_PSD_VD_V3的内部数据集，该数据集具有边界框+其他关键点注释。已经对以下三类进行了注释，

1483fed31df35c7327239e67ee42956e_954196d85a6741bd9bbad7a8b22fcc36.png

f4b701d72b84516647808896da7d67c6_b9eb51a9af1a472e9041de6fb14e2c87.png

1-空停车位

2-占用的停车位

3-车辆

方案

为每个停车点和车辆采集四个角点坐标。注释时保持关键点的顺序。第一和第二个关键点分别是停车点入口的左角和右角。其余角点沿逆时针方向捕捉。对于车辆，第一和第二关键点分别是包围车辆的矩形的地面上最左侧和最右侧的关键点。其他两个关键点是在车辆逆时针方向捕捉的车辆的其他两个角。

Bounding box参数是包围捕获的四个关键点的矩形框。边界框参数不带注释，而是在捕捉关键点后导出。

准确性

TI_PSD_VD_v3数据集的精度低于@IOU阈值=0.6。这是与下面提到的预训练模型相对应的精度。

|类别 |mAP|

|空停车位 |85.48%|

|占用停车位 |75.75%|

|车辆 |67.25%|

|平均AP |76.16%|

代码

#全部代码可加qq1309399183
def train():
    #parses command line args
    args = parse_args()
    #parses args from file
    if args.config_file is not None:
        cfg_from_file(args.config_file)
    if (args.FIX_MODEL_CHECKPOINT):
      args.FIX_MODEL_CHECKPOINT = args.FIX_MODEL_CHECKPOINT.replace(" ", "")
      args.FIX_MODEL_CHECKPOINT = args.FIX_MODEL_CHECKPOINT.replace("=", "")
      cfg.RESUME_CHECKPOINT = args.FIX_MODEL_CHECKPOINT
      cfg.CHECK_PREVIOUS = False
      if (os.path.exists(cfg.RESUME_CHECKPOINT) == False):
          print('Exiting the process as asked model for resuming is not found')
          exit()
    if (args.RESUME_CHECKPOINT):
      cfg.RESUME_CHECKPOINT = args.RESUME_CHECKPOINT
    if (args.LOG_DIR):
      cfg.EXP_DIR = args.LOG_DIR
    cfg.LOG_DIR = cfg.EXP_DIR
    if (args.PHASE):
      cfg.PHASE = []
      cfg.PHASE.append(args.PHASE)
    if (args.EVAL_METHOD):
      cfg.DATASET.EVAL_METHOD = args.EVAL_METHOD
    #for backward compatibility
    if cfg.DATASET.DATASET == 'psd':
      cfg.DATASET.DATASET = 'tiod'
    if cfg.DATASET.BGR_OR_RGB == True:
        #cfg.DATASET.PIXEL_MEANS = (123.68, 116.78, 103.94)
        #cfg.DATASET.PIXEL_MEANS = (123, 117, 104)
        cfg.DATASET.PIXEL_MEANS = (128.0, 128.0, 128.0) # simpler mean subtraction to keep data in int8 after mean subtraction
    print("cfg: ", cfg)
    for phase in cfg.PHASE:
      cfg_dir = cfg.LOG_DIR + '/' + phase + '_cfg/'
      os.makedirs(os.path.dirname(cfg_dir), exist_ok=True)
      shutil.copy(args.config_file, cfg_dir)
    # to making every run consistent # TII
    np.random.seed(100)
    torch.manual_seed(100)
    torch.cuda.manual_seed(100)
    random.seed(100)
    torch.cuda.manual_seed_all(999)
    torch.backends.cudnn.enabled = False
    train_model()
if __name__ == '__main__':
    train()

推理结果全部代码可私信

2ef7f2d8887c04205197abd100ec4ff1_4398740fed2e4a53ae3fc139459cb5e3.png

基于深度学习的鱼眼图像中的停车位识别和分类（毕业设计+代码）

概述

预知结果

数据集

方案

准确性

代码

推理结果全部代码可私信

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

基于深度学习的鱼眼图像中的停车位识别和分类（毕业设计+代码）

概述

预知结果

数据集

方案

准确性

代码

推理结果 全部代码可私信

热门文章

最新文章

相关课程

相关电子书

相关实验场景

推理结果全部代码可私信