当前位置:首页 > 娱乐 > 浪潮信息获CVPR2024自动驾驶挑战赛"Occupancy& Flow"冠军

浪潮信息获CVPR2024自动驾驶挑战赛"Occupancy& Flow"冠军

2024-09-13 15:39:24 [娱乐] 来源:代做病例单证明(微:7862262)

北京2024年6月25日 /美通社/ -- 近日,浪潮在全球权威的信息CVPR 2024自动驾驶国际挑战赛(Autonomous Grand Challenge)中,浪潮信息AI团队所提交的自战赛"F-OCC"算法模型以48.9%的出色成绩斩获占据栅格和运动估计(Occupancy & Flow)赛道第一名。继22、动驾23年在纯视觉和多模态等自动驾驶感知方向,驶挑多次登顶nuSences 3D目标检测榜单后,冠军该AI团队面向Occupancy技术再一次实现突破,浪潮实现了对高度动态及不规则的信息驾驶场景更精准的3D感知及运动预测。

图1-浪潮信息AI团队斩获占据栅格和运动估计赛道第一名
图1-浪潮信息AI团队斩获占据栅格和运动估计赛道第一名

CVPR 2024自动驾驶国际挑战赛是国际计算机视觉与模式识别会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition)的一个重要组成部分,专注于自动驾驶领域的动驾技术创新和应用研究。2024年CVPR自动驾驶国际挑战赛,驶挑包含感知、冠军预测、浪潮规划三大方向七个赛道,信息旨在深入探索自动驾驶领域的自战赛前沿课题。

三维感知和预测是自动驾驶领域的新兴任务,要求对车辆行驶场景进行细粒度建模,对于提升自动驾驶的环境感知能力有着重要意义。此次浪潮信息AI团队所登顶的占据栅格和运动估计(Occupancy & Flow)赛道,是CVPR 2024自动驾驶国际挑战赛最受关注的赛道,聚焦感知任务,吸引了全球17个国家和地区,90余支顶尖AI团队参与挑战。比赛提供了基于 nuScenes 数据集的大规模占用栅格数据与评测标准,要求参赛队伍利用相机图像信息对栅格化三维空间的占据情况(Occupancy)和运动(Flow)进行预测,以此来评估感知系统对高度动态及不规则驾驶场景的表示能力。

  • 占据栅格 Occupancy:挑战更精细的环境感知与预测

道路布局的复杂性、交通工具的多样性以及行人流量的密集性,是当前城市道路交通的现状,也是自动驾驶领域面临的现实挑战。为了应对这一挑战,有效的障碍物识别和避障策略,以及对三维环境的感知和理解就变得至关重要。传统的三维物体检测方法通常使用边界框来表示物体的位置和大小,但对于几何形状复杂的物体,这种方法往往无法准确描述其形状特征,同时也会忽略对背景元素的感知。因此,基于三维边界框的传统感知方法已经无法满足复杂道路环境下的精准感知和预测需求。

图2 - 针对挖车中的力臂,3D目标检测算法只能给出挖车整体的轮廓框(左),但占据栅格网络却可以更精准地描述挖车具体的几何形状这类细节信息(右)
图2 - 针对挖车中的力臂,3D目标检测算法只能给出挖车整体的轮廓框(左),但占据栅格网络却可以更精准地描述挖车具体的几何形状这类细节信息(右)

Occupancy Networks(占据栅格网络) 作为一种全新的自动驾驶感知算法,通过获取立体的栅格占据信息,使系统能够在三维空间中确定物体的位置和形状,进而有效识别和处理那些未被明确标注或形状复杂的障碍物,如异形车、路上的石头、散落的纸箱等。这种占据栅格网络使得自动驾驶系统能够更准确地理解周围的环境,不仅能识别物体,还能区分静态和动态物体。并以较高的分辨率和精度表示三维环境,对提升自动驾驶系统在复杂场景下的安全性、精度和可靠性至关重要。

  • 全面提升!48.9%的绝佳性能表现,创本赛道最高成绩

在占据栅格和运动估计(Occupancy & Flow)赛道中,该AI团队所提交的"F-OCC"算法模型,凭借先进的模型结构设计、数据处理能力和算子优化能力,实现了该赛道最强模型性能,在RayIoU(基于投射光线的方式评估栅格的占用情况)及mAVE(平均速度误差)两个评测指标中均获得最高成绩。

■ 更简洁高效的模型架构,实现运算效率与检测性能双突破

首先,模型整体选择基于前向投影的感知架构,并采用高效且性能良好的FlashInternImage模型。同时,通过对整体流程进行超参调优、算子加速等优化,在占据栅格(Occupancy)和运动估计(Flow)均获得最高分的同时,提升了模型的运算效率,加快了模型迭代与推理速度。在实际应用场景中,这种改进使得模型能够更快速、高效地处理大规模3D体素数据,使得自动驾驶车辆能更好地理解环境,进而提升决策的准确度和实时性。

图3  - F-OCC算法模型架构图
图3 - F-OCC算法模型架构图

■ 更强大完善的数据处理,全面提升模型检测能力

在数据处理方面,比赛提供的体素(Voxel)标签包含了大量在图像中无法观测到的点,例如被物体遮挡的体素和物体内部不可见的体素,这些标签在训练过程中会对基于图像数据的预测网络训练产生干扰。在训练数据中,该AI团队通过模拟LiDAR光束的方法,生成可视化掩码,提升了模型的预测精度;另一方面,通过引入感知范围边缘的体素点参与训练,有效解决出现在感知边缘区域的误检问题,将模型的整体检测性能提升11%。

■ 更精细的3D体素编码,模型占据预测能力提升超5%

在3D体素特征编码模块中,该算法团队将具有较大感知范围和编码能力的可形变卷积操作应用于3D体素数据,以提升3D特征的表示能力。通过使用CUDA对可形变3D卷积(DCN3D)进行实现与优化,大幅提升了模型的运算速度,并有效降低了显存消耗。通过DCN3D替代传统3D卷积,模型整体占据预测能力提升超5%。

基于OCC 3D空间感知算法的创新, "F-OCC"算法模型成功登顶占据栅格和运动估计任务(Occupancy & Flow)榜单,以48.9%的出色成绩创造了本赛道的最高成绩,为探索更高级别的自动驾驶技术提供了有力的支撑与经验。未来,浪潮信息AI团队将践行多角度切入,发挥算法、算力融合的AI全栈优化能力,推动自动驾驶领域的技术创新发展。

* 备注:文内所涉术语解释如下

 Occupancy在自动驾驶领域,通常称为“占据栅格”或“占用栅格”,其是一种3D语义占用感知方法,通过生成车辆周围环境的三维占用网格,为自动驾驶车辆提供障碍物检测、路径规划和车辆控制等关键功能;

RayIoU是指通过光线投射的方式评估占据网格的占用情况(Ray-based Intersection over Union)RayIoU可以用来衡量预测的占据网格与实际占据网格之间的重叠程度。RayIoU越高意味着预测准确度越高,模型性能越好; 

mAVE是指平均速度误差(Mean Absolute Velocity Error),其用于评估预测速度与真实速度之间的平均误差。mAVE值越低意味着预测结果与真值越接近;

体素(Voxel):体积元素(Volume Pixel)的简称体积元素(Volume Pixel)的简称,其类似于二维图像中的像素,是构成三维图像的基本单元。

 

(责任编辑:焦点)

推荐文章
  • 黟县洪星乡:“积分制”描绘乡村振兴好图景

    黟县洪星乡:“积分制”描绘乡村振兴好图景 每当晨曦初破,黟县洪星乡红光村村民汪大爷就走出门,拿起扫帚在房前屋后清扫。“自从去年因为环境卫生问题上了村里积分黄榜后,我就开始每天清扫庭院。今年年初,我登上了红榜,村里还对我进行了表彰。养成的好习惯 ...[详细]
  • 王玉民:他是传递向善向上的正能量

    王玉民:他是传递向善向上的正能量 这世界上再也没有比生命更宝贵的了。当陷入关乎生命的两难境地,该如何选择?一方是渐已年迈、残疾的病体,一方是未知水深、命悬一线的溺水者。生死一瞬,杜集区朔里镇矬楼村村民王玉民近乎本能的救人壮举感染了很多 ...[详细]
  • 青阳县庙前镇:走进傩面具文化 感受“非遗”魅力

    青阳县庙前镇:走进傩面具文化  感受“非遗”魅力 6月5日下午,池州市文旅局携老池口非遗项目调研组来到青阳县庙前镇星星村开展傩面具文化调研活动,傩面具雕刻传人刘千祥现场展示其雕刻手艺。通过亲身体验、现场采访的方式,调研组对非物质文化遗产--傩戏面具雕 ...[详细]
  • 俞金兰:七旬老太讲信誉敢担当

    俞金兰:七旬老太讲信誉敢担当 人物简介:俞金兰,女,1951年4月出生,群众,芜湖市南陵县家发镇永林村徐塘组村民。事迹简介:南陵县家发镇永林村,有一位名叫俞金兰的老太,不顾自己多病的身体,照顾父亲死亡、母亲离家的孙子,坚持打工挣钱 ...[详细]
  • 泗县:新时代文明实践点亮群众美好生活

    泗县:新时代文明实践点亮群众美好生活 近年来,泗县将新时代文明实践活动融入基层治理经验中,以文明实践为载体,搭好社会治理舞台,促进文明新风处处倡树,文明行动人人践行,用文明实践之歌奏响新时代社会治理乐章。党建引领志愿行动,吹响“冲锋号”。 ...[详细]
  • 甘肃山丹马场:一幅骏马扬蹄奔腾的盛夏牧马图

    甘肃山丹马场:一幅骏马扬蹄奔腾的盛夏牧马图 盛夏时节,甘肃山丹马场上,牧马人放牧的一群骏马扬蹄奔腾,与青青草色勾勒出了一幅壮美画卷。山丹马场位于河西走廊中部,地势平坦,水草丰茂,是马匹繁衍、生长的理想场所,因出产“山丹马”而闻名于世。 ...[详细]
  • 汪建荣:重义守信树典范 有爱有为显担当

    汪建荣:重义守信树典范 有爱有为显担当 在黄山市物流行业,汪建荣因守信重义、热心公益,赢得业界口碑,也因此当选2023年第四季度“黄山好人”。“爱学习,恨不上进”是汪建荣留给记者最深的印象。在他的办公室里,《利他心》《经营三十四问》《企业迷 ...[详细]
  • 定远县永康镇拂光村开展“我们的节日—端午”夏伴书香读书活动

    定远县永康镇拂光村开展“我们的节日—端午”夏伴书香读书活动 粽叶飘香的端午时节,定远县永康镇拂光村迎来了一场别开生面的“我们的节日—端午”夏伴书香读书活动。此次活动旨在将传统节日与阅读文化相结合,为村民们带来一次独特而富有意义的体验。活动现场,大家围坐在一起, ...[详细]
  • 桐城市龙眠街道:“信用礼遇”焕发乡村新风貌

    桐城市龙眠街道:“信用礼遇”焕发乡村新风貌 桐城市龙眠街道不断拓展“信用+”结果运用新路径,以党建引领,让信用生金,抓实抓好信用村建设结果运用,让农户切切实实感受到信用带来的红利,增强农户的获得感、荣誉感和幸福感,用“信用礼遇”为乡村治理注入新 ...[详细]
  • “00后”大学生捐献造血干细胞为男孩生命续航

    “00后”大学生捐献造血干细胞为男孩生命续航 造血干细胞是人体内能够分化为各种血细胞的原始细胞,对于血液病患者来说,是一种重要的治疗手段。11月17日,天长一名“00后”大学生王典成功捐献216毫升造血干细胞混悬液,为一名13岁男孩送去新生的希望 ...[详细]
热点阅读