超全自动驾驶开源数据集总结,一览自动驾驶发展历程
来源:3D视觉工坊添加微信:dddvisiona,备注:自动驾驶,拉你入群。文末附行业细分群。随着数据采集设备的优化升级,自动驾驶数据集也在不断升级迭代。国内外各大自动驾驶公司、研究所都先后推出自动驾驶数据集,为未来自动驾驶领域的技术发展提供重要研究材料。《自动驾驶开源数据体系:现状与未来》一文系统性地梳理自动驾驶开源数据集,对于助推产业生态良性循环有着重要意义。该文章是由上海人工智能实验室联合上
来源:3D视觉工坊
添加微信:dddvisiona,备注:自动驾驶,拉你入群。文末附行业细分群。
随着数据采集设备的优化升级,自动驾驶数据集也在不断升级迭代。国内外各大自动驾驶公司、研究所都先后推出自动驾驶数据集,为未来自动驾驶领域的技术发展提供重要研究材料。
《自动驾驶开源数据体系:现状与未来》一文系统性地梳理自动驾驶开源数据集,对于助推产业生态良性循环有着重要意义。该文章是由上海人工智能实验室联合上海交大、复旦大学、百度、比亚迪、蔚来等多个单位,发布的自动驾驶开源数据集综述。该综述首次系统性梳理了国内外七十余种开源自动驾驶数据集,对如何构建高质量数据集、数据在算法闭环体系中发挥的核心作用、如何利用生成式大模型规模化生产数据等进行了总结。在此基础上,对未来第三代自动驾驶数据集所应具有的特征、数据规模、需要解决的关键科学和技术问题展开深入分析与讨论。
论文地址:https://opendrivelab.com/Dataset_Survey_Chinese.pdf
项目地址:https://github.com/OpenDriveLab/DriveAGI
概述
自动驾驶作为人工智能重要应用领域之一,有望重塑现有的交通和运输模式,极大提升交通效率和安全性,对未来城市和社会发展产生深远影响。目前,国内的智能网联汽车产业已经迈入商业化的试水和起步阶段。道路测试和示范应用场景趋于成熟,自动驾驶功能技术加速迭代,车联网应用场景日益丰富,各层面相关法规政策加速出台,共同推动市场进入高速发展期。
一方面,自动驾驶技术需要大量数据来训练算法模型,以识别和理解道路环境,从而做出正确的决策和行动,实现准确、稳定和安全的驾驶体验,数据的建设对于自动驾驶技术的发展至关重要。另一方面,自然语言处理和通用视觉领域大模型的出现,更加印证了海量高质量数据的重要性,给予自动驾驶的数据集建设以启发!
综述文章架构
自动驾驶数据集
该综述把目前开源的近百种数据集分为两代:第一代数据集以 KITTI 为标志,该数据集于2012年提出,输入传感模态由单目摄像头与激光雷达构成,并提出了一系列综合感知任务。第二代数据集以 nuScenes 及 Waymo 数据集为代表,传感模态复杂度变高,环视相机、激光雷达、定位信息以及高精地图成为常见组成部分,下游任务面向感知、建图、预测与路径规划综合任务。
传感器模态复杂度逐渐提高:环视相机,激光雷达,高精地图,超声波雷达传感器,GPS、IMU、HD Map等。
数据集规模与多样性日益增长:在数据丰富度方面,主流自动驾驶数据集的采集时长由最初的10小时左右逐渐提升至100小时,随着自动标注技术及标注工具的演进,近些年也出现了超过 1000 小时的数据集。驾驶场景的多样性也是自动驾驶系统表现的另一关键因素。为了提高算法在特定场景下的表现能力,部分数据集分别在多个大洲多个城市进行采集。
数据集任务从感知延伸至预测与规划:2016 年推出的 Cityscapes 与 Mapillary 等数据集下游任务聚焦于动态物体检测。2019 年推出的 SemanticKITTI 、DrivingStereo等数据集引入语义分割、深度估计、光流估计等任务。在传统预测与规划模块一般应用数值计算、优化、搜索等方法求解。2019 年前后提出的 nuScenes、Waymo 、Argoverse V2 等数据集,不仅包括感知任务还涵盖预测与规划任务,实现了在同一数据集上进行多种任务研究,同时引领社区在传统多个模块范式下端到端自动驾驶研究的潮流。
自动驾驶开源数据集影响力估计
数据算法闭环体系
模块化自动驾驶系统包括感知、决策、规划、控制等组件,其中大部分功能是通过数据驱动的神经网络模型实现的。对于这些模块来说,海量和高质量的数据是确保模块性能的必要条件。
首先,海量数据的引入对于解决现存自动驾驶系统中的各种问题都很有必要。自动驾驶工程中一直存在的问题是长尾问题。其产生原因在于训练模型的数据量不足而导致存在少量情况未被模型学习,而在模型推理阶段,模型并不能对这些边缘场景给出正确的结果。另外,对于基于规则的模块,现有的方式是通过人工设计各种规则来使模块输出符合人为设计逻辑的结果。这个方法耗时耗力,并且难以覆盖所有情况,有可能导致自动驾驶系统在某些未见场景下失效。而使用数据驱动的神经网络代替这些模块是一个可能的解决方案。
同时,在神经网络学习过程中,数据噪声的引入会不可避免地对优化过程产生负面影响,并降低模型性能。数据质量不仅包括传感器数据的分辨率和同步性等,还包括标签的准确性。在这两个方面中,任意一个方面存在质量问题都直接影响着自动驾驶系统的性能和安全性。
综上,海量和高质量的数据成为构建自动驾驶系统必不可少的一个环节。
大模型时代下的新一代自动驾驶数据集
当前基础大模型在自然语言处理、计算机视觉等领域取得了举世瞩目的成果,但目前市面上还没有面向自动驾驶垂直领域的大模型。以其他领域的大模型作为参照,新一代数据集至少应将数据量提升至与其他领域相近才能够赋能自动驾驶大模型。
在保证数据数量的前提下,场景丰富度对算法性能更为重要。自动驾驶车辆在真实世界中会不可避免地遇到训练数据之外的场景大规模地应用自动驾驶技术必然要求模型能够在罕见场景中做出正确行为,避免发生危险或功能失效的情况。对于绝大多数交通场景来说,并不需要十分大量的数据就能够覆盖,而更需要关注的是长尾场景,由于某些交通场景十分罕见,如撞车等,数据的缺失会对自动驾驶系统的性能影响巨大。
第一、二代自动驾驶数据集已经不能够继续满足自动驾驶系统的发展需求,新一代数据集的建设亟待提上日程。在大模型时代,大数据成为新一代数据集不可缺少的一个特点。同时,模块化设计的自动驾驶系统在落地过程遇到迭代成本高、性能上界受限等问题,端到端自动驾驶架构逐步受到业界的青睐。除此之外,多模态传感器、高质量标注、模型逻辑推理能力等方面也需要得到重视。基于此,该综述总结归纳了新一代数据集的发展目标:面向多模态、保质保量;面向端到端、决策导向;面向智能化、逻辑推理。
大模型时代下的自动驾驶数据集展望
结论
该综述全面回顾了自动驾驶公开数据集的现状与挑战。针对数据算法闭环体系,结合当前大模型发展趋势,提出了下一代自动驾驶数据集的愿景与规划。该综述系统性地总结了自动驾驶发展历程中所使用的数据集,并展示了通过挑战赛与榜单促进社区发展的重要性;概括性地分析了自动驾驶数据算法闭环体系,并总结其中各个重要环节的作用,最后通过应用案例展现对数据算法闭环体系的使用方法。
—END—高效学习3D视觉三部曲
第一步 加入行业交流群,保持技术的先进性
目前工坊已经建立了3D视觉方向多个社群,包括SLAM、工业3D视觉、自动驾驶方向,细分群包括:
[工业方向]三维点云、结构光、机械臂、缺陷检测、三维测量、TOF、相机标定、综合群;
[SLAM方向]多传感器融合、ORB-SLAM、激光SLAM、机器人导航、RTK|GPS|UWB等传感器交流群、SLAM综合讨论群;
[自动驾驶方向]深度估计、Transformer、毫米波|激光雷达|视觉摄像头传感器讨论群、多传感器标定、自动驾驶综合群等。
[三维重建方向]NeRF、colmap、OpenMVS、MVSNet等。
[无人机方向]四旋翼建模、无人机飞控等。
除了这些,还有求职、硬件选型、视觉产品落地等交流群。
大家可以添加小助理微信: dddvisiona,备注:加群+方向+学校|公司, 小助理会拉你入群。
第二步 加入知识星球,问题及时得到解答
2.1 「3D视觉从入门到精通」技术星球
针对3D视觉领域的视频课程(三维重建、三维点云、结构光、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、源码分享、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答等进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业、项目对接为一体的铁杆粉丝聚集区,6000+星球成员为创造更好的AI世界共同进步,知识星球入口:「3D视觉从入门到精通」
学习3D视觉核心技术,扫描查看,3天内无条件退款2.2 3D视觉岗求职星球
本星球:3D视觉岗求职星球 依托于公众号「3D视觉工坊」和「计算机视觉工坊」、「3DCV」,旨在发布3D视觉项目、3D视觉产品、3D视觉算法招聘信息,具体内容主要包括:
收集汇总并发布3D视觉领域优秀企业的最新招聘信息。
发布项目需求,包括2D、3D视觉、深度学习、VSLAM,自动驾驶、三维重建、结构光、机械臂位姿估计与抓取、光场重建、无人机、AR/VR等。
分享3D视觉算法岗的秋招、春招准备攻略,心得体会,内推机会、实习机会等,涉及计算机视觉、SLAM、深度学习、自动驾驶、大数据等方向。
星球内含有多家企业HR及猎头提供就业机会。群主和嘉宾既有21届/22届/23届参与招聘拿到算法offer(含有海康威视、阿里、美团、华为等大厂offer)。
发布3D视觉行业新科技产品,触及行业新动向。
第三步 系统学习3D视觉,对模块知识体系,深刻理解并运行
如果大家对3D视觉某一个细分方向想系统学习[从理论、代码到实战],推荐3D视觉精品课程学习网址:www.3dcver.com
科研论文写作:
基础课程:
[1]面向三维视觉算法的C++重要模块精讲:从零基础入门到进阶
[2]面向三维视觉的Linux嵌入式系统教程[理论+代码+实战]
工业3D视觉方向课程:
[1](第二期)从零搭建一套结构光3D重建系统[理论+源码+实践]
SLAM方向课程:
[1]深度剖析面向机器人领域的3D激光SLAM技术原理、代码与实战
[2]彻底剖析激光-视觉-IMU-GPS融合SLAM算法:理论推导、代码讲解和实战
[3](第二期)彻底搞懂基于LOAM框架的3D激光SLAM:源码剖析到算法优化
[4]彻底搞懂视觉-惯性SLAM:VINS-Fusion原理精讲与源码剖析
[5]彻底剖析室内、室外激光SLAM关键算法和实战(cartographer+LOAM+LIO-SAM)
机器人导航与路径规划
[1]移动机器人规划控制入门与实践:基于Navigation2
视觉三维重建:
[2]基于深度学习的三维重建MVSNet系列 [论文+源码+应用+科研]
自动驾驶方向课程:
[1] 深度剖析面向自动驾驶领域的车载传感器空间同步(标定)
[2] 国内首个面向自动驾驶目标检测领域的Transformer原理与实战课程
[4]面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
[5]如何将深度学习模型部署到实际工程中?(分类+检测+分割)
无人机:
[1] 零基础入门四旋翼建模与控制(MATLAB仿真)[理论+实战]
最后
更多推荐
所有评论(0)