info
西门子:电池白皮书
行业动态
MORE...
应用案例
MORE...
技术前沿
MORE...
当前位置:首页 行业资讯 正文
国外AI研究小组提出VoxFormer:基于Transformer的3D语义场景完成框架
转载 :  zaoche168.com   2023年03月06日

理解整体3D图片是自动驾驶汽车(AV)感知的重大挑战,会直接影响以后的活动,如规划和地图创建。由于传感器分辨率低以及视野小和遮挡造成的局部观察使得获取关于实际环境的精确和全面的3D信息具有挑战性。语义场景补全(SSC)是一种从稀疏观察中联合推断整个场景几何和语义的方法,旨在解决这些问题。可视区域的场景重建和受阻部分的场景幻觉是SSC解决方案必须同时处理的两个子任务。人类很容易根据不完美的观察来推理场景几何和语义。

尽管如此,现代SSC技术在驾驶场景中的性能仍然低于人类感知。LiDAR是当前SSC系统中提供精确3D几何测量的主要模式。然而,摄像头的价格更低,且可以提供更好的驾驶环境视觉指示,而LiDAR传感器成本更高且不够便携。据外媒报道,国外研究小组基于MonoScene开发出VoxFormer,对摄像头的SSC解决方案进行进一步的研究。

图片来源:

其中MonoScene使用密集特征投影将2D图片输入转换为3D。然而,这样的投影给出了可视区域中空的或遮挡的体素2D特征。例如,被汽车覆盖的空体素仍然会获得汽车的视觉特征。

品牌社区
—— 造车工艺 ——
—— 数字化制造 ——
—— 智能驾驶 ——
—— 新能源技术 ——
—— 机器人技术 ——