近年来,基于神经网络的方法已广泛应用于基于摄像头的3D重建中。但在大多数情况下,3D重建仍然需要数百个摄像头视角才能完成。与此同时,虽然传统的光度测量方法可以计算出高精度的重建结果(即使是表面没有纹理的物体),但这些方法通常只能在受控的实验室条件下有效。
据外媒报道,慕尼黑工业大学(Technical University Munich)计算机视觉和人工智能系(Computer Vision and Artificial Intelligence)教授、慕尼黑机器学习中心(MCML)负责人兼慕尼黑数据科学研究所(MDSI)所长Daniel Cremers及其团队共同开发出仅使用2个摄像头视角实现3D重建的方法。
图片来源:Technical University Munich
该方法将表面的神经网络与照明过程的精确模型相结合,该模型能够考虑光吸收以及物体与光源之间的距离。而图像中的亮度可用来确定表面相对于光源的角度和距离。
Cremers表示:“这使得我们能够比现有工艺更精确地对物体进行建模。我们可以利用自然环境并重建相对无纹理的物体。”
这篇论文已在arXiv预印本服务器上发表,并将于2024年6月17日至6月21日在西雅图(Seattle)举行的计算机视觉与模式识别会议(CVPR 2024)上展示。
在自动驾驶和文物保护中的应用
该方法可用于保护历史古迹或数字化博物馆展品。如果这些文物遭到破坏或随时间腐烂,照片图像则可以用来重建原件并制作真实的复制品。
Cremers教授的团队还为自动驾驶开发了基于神经摄像头的重建方法,通过摄像头拍摄车辆周围的环境。自动驾驶汽车可以对周围环境进行实时建模,生成场景的三维表征,并以此来做出决策。
这一过程基于神经网络,可预测单个视频图像的3D点云,然后将这些点云合并为所行驶道路的大规模模型。