新软件系统快速创建图像集 可用于训练自动驾驶汽车的视觉系统

   2023-07-20 盖世汽车Fairy450
核心提示:人工智能非常适用于创建训练自动驾驶汽车和其他机器查看周围环境所需的大量图像集,但目前的生成式AI系统存在缺点,可能会限制其

人工智能非常适用于创建训练自动驾驶汽车和其他机器查看周围环境所需的大量图像集,但目前的生成式AI系统存在缺点,可能会限制其应用。据外媒报道,美国普林斯顿大学的工程师们研发了一个软件系统,可克服此类缺点,且可快速创建图像集,以让机器为所有视觉环境做好准备。

deng_1.jpg

图像集(图片来源:普林斯顿大学)


该新系统名为Infinigen,主要依赖数学创造自然外观的三维物体和环境。该系统是一个程序生成器,在计算机科学中,指代一种基于自动化的、人类设计的算法来创建内容的程序,而不是基于劳动密集型的人工数据输入或驱动现代AI的神经网络。通过此种方式,新程序仅使用随机的数学规则就可生成无数个3D物体。

普林斯顿大学计算机科学副教授 Jia Deng的一篇论文详细介绍了软件系统Infinigen。Jia Deng表示:“Infinigen是一个动态程序,可以构建无限的、多样化的、逼真的自然场景。”

Infinigen的数学方法允许其创建标记好的视觉数据,此类数据是训练部署于家用机器人、自动驾驶汽车等设备上视觉系统所必须的。因为Infinigen以编程的方式生成每张图像,即首先创建一个3D世界,在其中填充物体,然后放置摄像头拍照,Infinigen可以自动提供每张图像的详细标签,包括每个物体的类别和位置。

然后,带有自动标签的图像可用于训练机器人识别和定位仅把图像作为输入信息的物体。Deng教授表示,现有的人工智能图像生成器中是不可能实现此种标记好的视觉数据的,因为此类程序采用不允许提取标签的深度神经网络来生成图像。

此外,Infinigen的用户可以对系统的设置进行细粒度的控制,例如精确的灯光和视角,并可以对系统进行微调,让作为训练数据的图像变得更有用。

除了生成具有自然形状、大小、纹理和颜色的数字对象组成的虚拟世界外,Infinigen还可扩展至合成火、云、雨和雪等自然现象。

Deng教授表示:“我们希望Infinigen可被证明为是一种有用的资源,不仅用于创建训练数据,还可用于增强现实、虚拟现实、游戏开发、电影制作、3D打印和内容生成等。”

为了创建Infinigen,普林斯顿大学的研究人员从免费使用的开源图形系统Blender开始,该图形系统可追溯至上世纪90年代,是一个预建软件的工具。为了遵循Blender的开源免费精神,普林斯顿大学的研究人员已经在GPL兼容许可下发布了Infinigen的代码,因此任何人都可免费使用Infinigen。

Infinigen的另一个关键优势是,可通过大幅扩展3D渲染物体和景观的菜单,提高机器从2D像素对复杂空间进行3D重建的能力。Deng教授表示,从真实世界图像转为合成图像,以研发在真实世界中移动的汽车和机器人似乎是反直观的,但真实数据集有关键的局限性。

首先,引导机器人和智能汽车的计算机不能像人类一样感知图像和其他视觉物体。在人类看来是三维的图像,在计算机看来是二维集合。为了让机器人感知3D图像,图像需要包括一个被称为“3D基准真值”的指令,这对于现有的2D图像而言很难,但对于类似Infinigen的系统而言非常简单。

Deng教授表示:“3D图像合成数据集已经初步显示出巨大的发展前景,我们研发的Infinigen可进一步实现该前景。”

普林斯顿大学的研究人员为Infinigen设计了称为生成器的子程序,专门用于产生单一的、不同类型的数字物体,如“鱼”或“山”。用户可以使用子程序来定制一系列参数,包括大小尺寸、纹理、颜色和反射率。

Deng教授表示:“用户可以根据自己的需求调整参数,创造出尽可能真实或不真实的环境,此种扩展性可确保机器得到广泛的训练,以处理所有可能遇到的环境中或在此类环境中导航。”研究人员希望,Infinigen可成为一种协作工具,允许用户在开发过程中添加更多功能。

Deng教授表示:“我们的目标是让Infinigen的覆盖范围变得非常广,让其变成计算机视觉训练数据的首选,无论任务是什么。我们希望Infinigen成为一个协作型、由社区驱动的产品,为很多用户提供益处的工具。”


 
反对 0举报 0 收藏 0 打赏 0评论 0
 
更多>同类行业资讯
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备20010165号-1