无人驾驶中常用的37个数据集以及每个数据集的亮点

简介: 我们在写论文的时候,经常会用到数据集.以下是我的一些整理.

打开检查的快捷键是ctrl+shift+i

1.Automotive multi-sensor dataset
https://goo.gl/1YbD5E
亮点:全方位视觉数据,实现全方位环绕感测;包括冬季有雪的情况

2.Apollo
https://goo.gl/yy144b
亮点:来自多个传感器的大量注释数据,适合深度学习和训练任务;支持开源项目

3.Berkeley DeepDrive Video dataset
https://goo.gl/24XNzG
亮点:具有各种注释的大型驾驶视频数据集

4.Caltech Pedestrian Detection Benchmark
https://goo.gl/HB7e8P
亮点:最大的行人数据集;行人注释;第一个在边界框和遮挡标签之间具有时间对应关系的数据集

5.Cambridge-driving Labeled Video Database
https://goo.gl/I2pbdP
亮点:第一批带有对象类语义标签的视频;像素级注释

6.CCSAD dataset
https://goo.gl/pxr3Yc
亮点:在发展中国家拍摄的立体声视频

7.Cheddar Gorge Dataset
亮点: 配备立体、单目和红外摄像头、V elodyne 64激光雷达、GPS/IMU等的多样化传感器。

8.Cityscapes dataset
https://goo.gl/qLM3V4
亮点: 来自50个城市的立体声序列;用于语义城市场景理解的像素级注释;带有评估服务器的基准测试套件;一个新的数据集,有更好的人注释的基础

9.CMU Visual Localization Dataset
https://goo.gl/0R8XX6
亮点: 各种天气和光照条件

10.comma.ai driving dataset
https://goo.gl/B3TWf2
亮点: 高速公路交通场景

11.Daimler Pedestrian Benchmarks
https://goo.gl/l3U2Wc
亮点:包含多个基准数据集,用于基于单目和立体图像的行人检测、分类、分割和路径预测;第一个数据集包含部分闭塞的行人;包括我们迄今为止遇到的唯一一个骑车人数据集

12.Daimler Urban segmentation
https://goo.gl/KRBCLa
亮点:城市交通中的立体视觉序列;像素级语义类标注

13.DIPLECS Autonomous Driving Datasets
https://goo.gl/8isjeJ
亮点: 包括两个关于公共道路的数据集,一个在英国,另一个在瑞典;逐帧标记速度和转向数据(第一个数据集)以及驾驶环境和驾驶员动作(第二个数据集)

14.Dr(eye)ve
https://goo.gl/45bwXr
亮点:研究驱动力、眼睛注视和视觉显著性的第一个数据集

15.EISATS
https://goo.gl/ausKsL
亮点: 包括多个带有立体视觉序列的数据集,用于比较立体视觉、光流、运动分析等的性能评估。

16.Elektra
https://goo.gl/GNNq0f
亮点: 注释行人的各种图像;包括远红外图像

17.ETH pedestrian dataset
https://goo.gl/xXDTwI
亮点: 在人满为患的市中心拍摄的立体图像,行人众多

18.EuroCity Persons Dataset
亮点: 在各种天气和光照条件下,城市交通中有大量带有人物注释的图像

19.F ord Campus Vision and Lidar DataSet
https://goo.gl/6ZkCpc
亮点: 传感器设置多样化,包括高精度定位设备、多个激光雷达、全方位摄像头等;全面的软件支持

20.German Traffic Sign Detection Benchmark
https://goo.gl/FqaCJQ
亮点: 德国有交通标志的静态图像

21.HCI benchmark suite
https://goo.gl/r5aRvv
亮点: 一个用于城市自动驾驶的高精度立体和光流数据集,包含许多在同一条街上手动构建/执行的场景

22.Heidelberg benchmarks
https://goo.gl/6c2lAs
亮点:与名为“强健视力挑战”的活动相关;提供具有挑战性的立体声和光流数据,例如雨点和飞雪

23.Joint Attention for Autonomous Driving
Dataset
https://goo.gl/cXoPnp
亮点: 注重行人和司机的共同关注,实现自动驾驶;为行人和车辆提供文本和行为注释

24.KAIST multispectral pedestrian detection
dataset
https://goo.gl/Tpz512
亮点:带行人注释的彩色热图像对对齐良好

25.Karlsruhe Dataset: Labeled Objects
https://goo.gl/5fk0js
亮点:带有汽车和行人对象边界框的图像;甚至包括对象定向

26.Karlsruhe Dataset: Stereo Video Sequences +
rough GPS Poses
https://goo.gl/V6Q7Vx
亮点: 卡尔斯鲁厄的高质量立体声序列

27.KITTI Vision Benchmark Suite (KITTI)
https://goo.gl/cvSbGl
亮点: 目前最负盛名的自动驾驶数据集;为立体视觉、光流、场景流、视觉里程计、SLAM、目标检测和跟踪、道路车道检测、语义分割的评估提供了许多优秀的基准

28.Málaga Stereo and Laser Urban DataSet
https://goo.gl/EdLHtW
亮点:有据可查;全方位工具支持;主页上的留言板

29.Mapillary Vistas Dataset
https://goo.gl/1L4yj1
亮点: 大量具有巨大地理多样性的图像,注释为66–129个对象类别,涵盖各种道路/天气/光照条件

30.nuScenes数据集
https://www.nuscenes.org/
亮点: 自动驾驶汽车的整个传感器套件提供的第一个大规模数据

31.Oxford robotcar dataset
https://goo.gl/nJOQkq
亮点:第一个数据集强调定期长期数据收集(一年以上),遵循预定义路线,以涵盖道路状况的长期变化

32.Stanford track collection (Stanford)
https://goo.gl/KNOYpX
亮点:带对象标签和GPS/IMU数据的V elodyne 64点云

33.Ground Truth Stixel Dataset (Stixel)
https://goo.gl/rf12z6
亮点: 高速公路上下大雨;像素注释

34.TorontoCity benchmark
亮点:具有广泛视图的数据,用于映射、重建和语义标记

35.TrafficNet
http://traffic-net.org
亮点: 大型可扩展的自然驾驶场景库

36.TRoM: Tsinghua Road Marking
https://goo.gl/KA7DR3
亮点:第一个与道路标记检测相关的公开数据集

37.Udacity dataset
https://goo.gl/AoxEt1
亮点:开源项目;驱动部分包含注释对象的数据

相关文章
|
6月前
|
人工智能
港科大等发布多模态图推理问答数据集GITQA
【2月更文挑战第14天】港科大等发布多模态图推理问答数据集GITQA
140 7
港科大等发布多模态图推理问答数据集GITQA
|
机器学习/深度学习 人工智能 数据挖掘
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
数据上新 | AI Earth上线长时序土地覆盖数据集(来自武汉大学黄昕教授团队)
|
1月前
|
存储 数据采集 数据安全/隐私保护
商汤、清华、复旦等开源百亿级多模态数据集,可训练类GPT-4o模型
商汤科技、清华大学和复旦大学等机构联合开源了名为OmniCorpus的多模态数据集,规模达百亿级,旨在支持类似GPT-4级别的大型多模态模型训练。该数据集包含86亿张图像和1696亿个文本标记,远超现有数据集规模并保持高质量,具备广泛来源和灵活性,可轻松转换为纯文本或图像-文本对。经验证,该数据集质量优良,有望促进多模态模型研究,但同时也面临存储管理、数据偏见及隐私保护等挑战。
145 60
|
3月前
|
机器学习/深度学习 数据采集 人工智能
揭秘AI的魔法:如何用机器学习预测股市走势
在金融领域,股市走势的预测一直是一个复杂而充满挑战的问题。随着人工智能技术的发展,机器学习已经成为解决这一问题的有力工具。本文将介绍如何使用机器学习技术来预测股市走势,包括数据准备、模型选择和结果分析等步骤。我们将通过具体实例和数据分析,展示机器学习在股市预测中的应用,并探讨其优势和局限性。最后,我们将提出一个开放性问题,引导读者进一步思考和探索。
|
数据库
开源数据集——行人数据
开源数据集——行人数据
3400 0
开源数据集——行人数据
|
机器学习/深度学习 人工智能 自然语言处理
KDD 2023 | GPT时代医学AI新赛道:16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布
KDD 2023 | GPT时代医学AI新赛道:16万张图片、70万问答对的临床问答数据集MIMIC-Diff-VQA发布
245 0
|
机器学习/深度学习 人工智能 数据可视化
人工智能创新挑战赛:助力精准气象和海洋预测Baseline[2]:数据探索性分析(温度风场可视化)、CNN+LSTM模型建模
人工智能创新挑战赛:助力精准气象和海洋预测Baseline[2]:数据探索性分析(温度风场可视化)、CNN+LSTM模型建模
人工智能创新挑战赛:助力精准气象和海洋预测Baseline[2]:数据探索性分析(温度风场可视化)、CNN+LSTM模型建模
|
机器学习/深度学习 JSON 编解码
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
伯克利开源首个泊车场景下的高清数据集和预测模型,支持目标识别、轨迹预测
237 0
|
数据采集 人工智能 算法
ECCV 2022 | 76小时动捕,最大规模数字人多模态数据集开源
ECCV 2022 | 76小时动捕,最大规模数字人多模态数据集开源
178 0
|
机器学习/深度学习 数据可视化
机器学习实战三: 预测汽车油耗效率 MPG
机器学习实战三: 预测汽车油耗效率 MPG
机器学习实战三: 预测汽车油耗效率 MPG