6月6日,日本理化学研究所RIKEN研究人员表明,只需对通常用于增强图像的算法进行微小调整,就可以显著提高从自动驾驶汽车到虚拟分身等应用中的计算机视觉识别能力。
图片来源:RIKEN
与大多数人工智能(AI)专家不同,RIKEN高级智能项目中心的Lin Gu是一位职业治疗师,因此会对尺度方差有独特的见解,即计算机视觉面临的一个关键问题:在图像中准确检测不同尺度的物体的难度。由于大多数AI系统都是在高分辨率图像上训练的,因此具有模糊或扭曲特征的逼真低质量图片对识别算法造成了挑战。
Lin Gu表示:“人类视觉具有大小恒定性,这意味着无论视网膜图像如何变化,我们都会将物体视为相同大小。相比之下,现有的计算机视觉算法缺乏那种稳定性。”
现在,受大脑用来形成记忆的海马回放技术的启发,Lin Gu和同事开发出行模型,可以随机降低高分辨率图像的分辨率、模糊度和噪声,以寻找在重复变化后保持不变的特征。
通过对生成的数据进行训练,该算法可以执行自我监督学习:帮助其他图像处理算法在没有人工干预的情况下找出图像中的对象,以及它们所在的位置。结果获得一种计算效率更高的编码和恢复图像关键细节的方法。
Lin Gu表示:“在典型的自我监督学习方法中,在学习监督信号之前,训练数据是通过屏蔽部分图像或改变对比度来修改。我们首次提出将决议作为自我监督的线索。”
除了典型的计算机视觉用途外,Lin Gu指出,感知常数表示将成为与电子人和分身相关的技术的基本组成部分。
Lin Gu表示:“对于人工记忆机制,分辨率变化不变的表示可以充当基石。我正在与RIKEN的神经科学家合作,探索人工永久恒定表征与大脑中真实表征之间的关系。”
这种方法也被应用于太赫兹成像——一种新兴的非破坏性成像技术,在生物医学、安全和材料表征方面具有巨大潜力。Lin Gu表示:“作为与牛津大学Michael Johnston团队合作的一部分,我们正在开发新一代太赫兹成像设备,通过使用AI来提高其质量和分辨率。”