什么样的方案，夺得了CVPR自动驾驶挑战赛冠军？

2023-06-23 19:33:06 机器之心

机器之心报道

(资料图片仅供参考)

编辑：小舟

自动驾驶中的三维占用预测难题，一场比赛给出了解决方案。

道路错综复杂、交通工具形态各异、行人密集，这是当前城市道路交通的现状，也是自动驾驶领域面临的现实挑战。为了应对这一挑战，感知和理解三维环境至关重要。

在传统的三维物体检测任务中，前景物体通常由三维边界框表示。然而，这种方法存在一些弊端，一方面，现实世界的物体几何形状非常复杂，无法用简单的三维框表示；另一方面，这种方法容易忽略背景元素的感知。对于实现全面的 L4/L5 自动驾驶，传统的三维感知方法是远远不够的。

最近，端到端自动驾驶研讨会 (End-to-End Autonomous Driving Workshop) 联合视觉中心自动驾驶研讨会 (Vision-Centric Autonomous Driving Workshop) 在 CVPR 2023 上举办了自动驾驶挑战赛，其中就包括三维占用预测（3D occupancy prediction）赛道。

图 1 CVPR2023 自动驾驶挑战赛

三维占用预测是自动驾驶领域的新兴任务，要求对车辆行驶场景进行细粒度建模，对于实现自动驾驶的通用感知能力有着重要意义。比赛提供基于 nuScenes 数据集的大规模占用预测评估基准，对三维空间进行体素化表示，并在三维占用任务的基础上结合两项新任务：估计三维空间中体素的占据状态和语义信息。整个任务旨在在给定多视角图像的情况下对三维空间进行密集预测。

本次比赛是三维占用感知领域的首个国际顶尖权威赛事，吸引了业界和学界的广泛关注。比赛共有 149 个团队参与角逐，其中包括来自小米汽车，华为，42dot，海康威视的业界团队，也有来自北京大学，浙江大学，中国科学院等科研院所的学术界团队。

最终，来自英伟达 (NVIDIA) 和南京大学的团队在激烈的竞争中脱颖而出，同时赢得了三维占用预测任务的冠军和最佳创新奖两个重磅奖项。下面我们来看一下冠军团队的获奖方案。

冠军方案

不同于以往比赛对于数据利用方面的限制，本次自动驾驶比赛允许参赛者使用额外的开源数据或者模型进行数据驱动算法的探索。因此在本次比赛中，英伟达和南大的研究人员在设计高效的模型结构的基础上，也在大模型的训练方面进行了探索，将模型参数扩展到 10 亿量级，达到过去常用 3D 感知模型的 10 倍以上。

凭借先进的模型结构设计和大模型强大的表征能力，该团队提出的方案 FB-OCC 实现了单模型 50+% mIoU 的出色性能，并最终取得了 % mIoU 的最佳成绩。

网络架构

FB-OCC 的主要创新在于使用了前向和后向投影相结合的三维空间建模方式。

如图 2 所示，在前向投影过程中，参考 LSS 投影范式，FB-OCC 会根据每个像素的深度分布生成场景对应的三维体素 (3D voxel) 表征。同时，由于 LSS 范式生产的特征倾向于稀疏且不均匀，FB-OCC 引入反向投影机制来优化稀疏的场景特征。

图 2 网络架构图

此外，考虑到计算负担，FB-OCC 在方向投影的过程中会将场景特征压缩为鸟瞰图 (BEV) 表征，最后将三维体素表征和鸟瞰图表征相结合。结合后得到的三维体素特征在后续还会经过额外的体素编码器 (Voxel encoder) 来增强特征感受野。

大规模模型探索

增加模型参数量是提升模型精度的最便捷的方式，但在三维视觉感知领域，研究人员发现更大规模的模型更容易产生过拟合现象，而现有主流感知模型的参数仍在 100M 量级。

在本次比赛中，FB-OCC 模型尝试使用 10 亿参数量级的 InternImage 主干网络，模型总体参数量是现有常用模型的十倍以上。大模型训练通常需要大数据与之匹配，但受限于自动驾驶数据采集标注的高昂成本，开源的三维感知数据集并不足以支撑 10 亿参数规模的模型。

针对这个痛点，FB-OCC 使用了多轮预训练机制。由于可获取的二维感知数据集远远丰富于三维感知数据，FB-OCC 首先在大规模开源数据集 Objects365 上进行通用目标检测预训练。然后，如图 3 所示，FB-OCC 引入深度和语义联合预训练来建立二维感知和三维感知的桥梁。

图 3 深度和语义联合预训练

为了生成语义分割标签，FB-OCC 还使用 Meta 的 SAM 模型来进行自动标注，分别使用框提示和点提示来生成不同类别的语义。经过多轮预训练后，大规模模型在占用感知任务上可以避免严重的过拟合问题。

实验结果

研究团队在实验中证明了 FB-OCC 的出色性能。如表 1 所示，FB-OCC 在 ResNet-50 主干网络以及 256x704 分辨率的输入图像下，借助时序融合、深度监督等技术，模型性能从最初的 % mIoU 增长至 % mIoU。

表 1 小规模模型的消融实验结果

为了获得更好的精度，FB-OCC 使用了更大参数量的模型。如表 2 所示，在 400M 的模型规模下，FB-OCC 获得了单模型 50+% mIoU 的效果。借助 InternImage 主干网络，10 亿参数量级的模型进一步取得了 % 的极佳效果。

表 2 不同模型规模下的效果

最终，FB-OCC 多个模型的集成结果取得了目前测试集上最高的准确率 ——%，赢得了比赛的冠军并被授予最佳创新奖。FB-OCC 为自动驾驶中复杂的三维占用预测问题贡献了新的思路。

©THE END

转载请联系本公众号获得授权

投稿或寻求报道：content@

华为向日本公司收专利费

输血79亿！中东巨鳄看上蔚来 天天微资讯

​每个人都是自己的“主角”，现代京剧《主角》即将上演 天天速讯

打造标杆绿色建筑 台泥大陆运营总部封顶

焦点播报:斯威汽车质量怎么样值不值得购买_斯威汽车质量怎么样

今日6月23日养老金调整方案公布了?企退人员养老金计算公式揭晓-环球关注

焦点播报:早上七点！事发南昌一公园！情况紧急……

湖湘自然历｜石韫玉而山晖㉓能焊接黄金的凤凰石 环球热头条

20家老字号品牌入驻保定宴饮食博物馆

迪拜在地图上的位置图_迪拜在地图上的位置

政府推出三地段 开启裕廊湖区120公顷新地区发展|每日观察

工艺笤帚“守艺人”：巧手编制的端午祝福

关于在民勤县主动创稳青少年书画大赛中增加获奖名额的补充通知-前沿热点

每日热文：晚上为什么不能刮痧 晚上为什么不能刮痧拔罐

山东银湾物业在河北设立保洁服务公司 持股100％ 环球消息

每日速看!惊险！男子洗车时突然触电 路人施救也遭电击

世界热推荐：四川省小金县发布雷电黄色预警

《方案》已印发！要生小孩的一定要看！-全球报资讯

胶囊咖啡一定要用咖啡机吗（胶囊咖啡一定要用咖啡机吗(意式浓缩咖啡）

天天热推荐：省运会皮划艇赛场又奏凯歌！洛阳小将成就双冠

多肉浇水方法,春季每周需要浇水一到两次

全球今亮点！工艺笤帚“守艺人”：巧手编制的端午祝福

世界微资讯！弘扬奥林匹克精神 习近平这些话鼓舞人心

董村村(关于董村村的简介)_世界微动态

即时看！荷兰或于下周发布新的对华芯片设备出口管制措施

微视频｜家国情长 世界快讯

mfc120enu.dll丢失如何一键修复_每日时讯

孖孖网红小女孩（孖）_焦点快报

包粽子、套圈圈、夹红枣...湖北鄂州携手30余名残疾人度过别样端午节

今年 “端午”假期广九客运段首趟普速临客顺利开出-世界百事通

当前通讯！文班亚马：我会尽全力去努力学习 我想要夺冠

迎端午，与培智学校的孩子们共度佳节

环球今日报丨加快政策部署 增强产业扶持 欧盟能否实现“芯片雄心”？（环球热点）

打通信息孤岛！监管部门酝酿商业健康险信息与医保信息共享 涉及六大合作领域 当前视点

【环球新视野】飞盘、露营降温，骑行却还一直火火火到“堵车”

今热点：太阳系外行星又获中国名 “丹凤”“青鸾”遨游星海

苹果分析师：新款 iPhone SE 很难在 2024 年推出

“小而美”的魅族旗舰——魅族20，那是相当值得购买的

为下代旗舰让路！骁龙8Gen2手机跌破3000元 世界聚焦

甘肃兰州：港澳内地青年体验扎染技艺了解传统文化

那些逐渐“消失”的福州端午习俗，你知道吗？_环球热讯

天天热门:江西赣州市赣县区大田乡：月洲坝集市中的端午节

静安交警端午小长假前夕开展交通安全集中治理|全球最新

全球速讯：50岁男人过生日送什么礼物最好看？文学专家分享沉船式创意服装DIY指南！

世界今亮点！什么？！深圳把港口建成“科幻片”？｜发现大湾区

英国央行上调基准利率至5%

铁路等部门积极保障端午假期旅客出行 世界热资讯

预告｜6月24日晚8点，央视一套《非遗里的中国》重磅推介郴州

喜上眉梢，翻身财运旺的四大生肖，好事不断，注定福禄多多

今年 “端午”假期广九客运段首趟普速临客顺利开出 头条焦点

美国隐藏的强大实力，不止是海军，我们如未及时发现将会非常危险_全球新视野

全球新动态：女篮亚洲杯实力榜更新：中国女篮升至第一位

珲春市举办2023年中俄青少年文化交流活动

焦点信息:不得不服！这个夏天太阳队会把西部其他球队彻底逼疯

全球快资讯：点痣后多久能掉疤？

全球快看点丨多地端午假期首日旅游成绩单出炉 你贡献了多少？

农业机械化有力保障夏粮收获——从夏收一线看农业强国建设之一 速看料

痛别！南京长江大桥桥头堡设计者钟训正院士逝世-天天信息

世界看热讯：英国民众苦通胀“高烧不退” 政府难有良策失民心

我国累计招收博士后约34万人（新数据 新看点）_环球快看

广西毒品犯罪案件数量呈下降态势 全球热推荐

全球热推荐：养成健康生活方式，别让“癌从口入”

6月21日北向资金最新动向（附十大成交股）

天天消息！OK镜生意不好做？欧普康视紧盯青少年钱袋，砸千万押注“近视神药”阿托品

世界首台换运架一体机“太行号”投用 4小时换梁效率提升3倍

当前观察：霍山县扎实开展“幼小科学衔接”活动

美国又被打破一个芯片垄断，国产小厂商蛇吞象还实现自主研发|每日视点

广东开展荔枝保鲜科研攻关 有望达到保鲜15天-热点评

激活数据要素潜能 数据要素统一大市场对接活动在郑州举行

陕西秦雍城发现春秋时期秦国大型建筑遗址

风向远夏里 小说_风向远夏里

当前热讯：今年夏天高温为何提前“报到”

显卡神器GPU-Z今年第二次升级：支持一大波新卡_全球视讯

又有新动作！乐山电力年内已与10家供电公司达成储能项目、智慧能源运营等合作意向

环球焦点！【电诉宝】用户投诉“快手”商家货不对板？ 退回反倒需被扣钱

微头条丨合康新能：拟定增募资不超过14.7亿元

帆船爱好者看过来！不出北京这里一样可实现扬帆碧浪|世界观点

世界看热讯：江西乐安：抓好考核“三个点” 助力营商环境再提升

贾玲宣布减肥100斤，近照颜值逆天，我却笑不出来…

超智能控股(01402.HK)将于9月6日派发末期股息每股0.005港元 当前消息

输血79亿！中东巨鳄看上蔚来天天微资讯

每个人都是自己的“主角”，现代京剧《主角》即将上演天天速讯

打造标杆绿色建筑台泥大陆运营总部封顶

湖湘自然历｜石韫玉而山晖㉓能焊接黄金的凤凰石环球热头条

政府推出三地段开启裕廊湖区120公顷新地区发展|每日观察

每日热文：晚上为什么不能刮痧晚上为什么不能刮痧拔罐

山东银湾物业在河北设立保洁服务公司持股100％环球消息

每日速看!惊险！男子洗车时突然触电路人施救也遭电击

世界微资讯！弘扬奥林匹克精神习近平这些话鼓舞人心

微视频｜家国情长世界快讯

当前通讯！文班亚马：我会尽全力去努力学习我想要夺冠

环球今日报丨加快政策部署增强产业扶持欧盟能否实现“芯片雄心”？（环球热点）

打通信息孤岛！监管部门酝酿商业健康险信息与医保信息共享涉及六大合作领域当前视点

为下代旗舰让路！骁龙8Gen2手机跌破3000元世界聚焦

铁路等部门积极保障端午假期旅客出行世界热资讯

今年 “端午”假期广九客运段首趟普速临客顺利开出头条焦点

全球快看点丨多地端午假期首日旅游成绩单出炉你贡献了多少？

农业机械化有力保障夏粮收获——从夏收一线看农业强国建设之一速看料

我国累计招收博士后约34万人（新数据新看点）_环球快看

广西毒品犯罪案件数量呈下降态势全球热推荐

广东开展荔枝保鲜科研攻关有望达到保鲜15天-热点评

激活数据要素潜能数据要素统一大市场对接活动在郑州举行

风向远夏里小说_风向远夏里

环球焦点！【电诉宝】用户投诉“快手”商家货不对板？退回反倒需被扣钱

超智能控股(01402.HK)将于9月6日派发末期股息每股0.005港元当前消息

科技类小说现代科技类小说今日精选

粽叶飘香迎端阳民族团结一家亲

赶着回家过节走错路，他在高速上调头逆行快播

信息：有哪些好玩的传奇私服手游热门传奇私服手游十大排行榜单

【赣州新观察】吉安白癜风研究医院热门选评：吉安白癜风医院案例（白癜风）

通讯！端午旅游不忘文明

好消息！渝昆高铁华福特大桥建设进度条更新了焦点短讯

大街小巷粽子飘香天天播报

【全球播资讯】国家女排与香港特区纪律部队举行友谊赛现场气氛热烈

中国电力（02380.HK）6月23日收盘跌3.6%，主力资金净流入456.57万港元环球实时

环球简讯:多地新增地方政府债务预算调整呈现差异化、精准化特征

“油电同价”概念火热业内称或有炒作之嫌-世界报资讯

安全海南 | 海南消防全面做好端午安全防范这些假期提示请查收！

80年代云南西双版纳制作的银饰把各族妇女打扮得漂漂亮亮_每日视点

输血79亿！中东巨鳄看上蔚来天天微资讯

新款旗舰性价比之王墨蛇P60 pro手机测评

中国女篮新消息，两大主力缺席，日本女篮针对李梦，最新首发揭晓信息

精达股份拟发不超11.26亿可转债近3年2募资共10.8亿-环球看热讯

公益微视频｜珍惜粮食，你我有责热推荐

每个人都是自己的“主角”，现代京剧《主角》即将上演天天速讯