用于图像识别的人工智能(AI)技术具有模仿人类视觉和大脑神经元的结构。目前有3种已知的方法可以减少计算视觉和神经元所需的数据量。迄今为止,这些方法的应用比例都是通过反复试验确定的。据外媒报道,日本筑波大学(University of Tsukuba)研究人员开发出一种新算法,可以自动识别每种方法的最佳比例。该算法有望降低AI技术的功耗,并促进半导体的微型化。
图片来源:《IEEE Access》
卷积神经网络(CNNs)可在机场出入境的面部识别和自动驾驶汽车的物体检测等应用中发挥关键作用。卷积神经网络由卷积层和全连接层组成;前者模拟人类视觉,后者使大脑能够从视觉数据中推断出图像的类型。通过减少计算中使用的数据位数,卷积神经网络可以在保持识别准确性的同时大幅降低计算需求。这种效率使得支持硬件更加紧凑。
到目前为止,研究人员已经确定了3种简化方法:网络精简(NS)以最小化视觉组件,深度压缩(DC)以减少神经元组件,以及整数量化(IQ)以减少使用的比特数。在此之前,对于这些方法的执行或分配顺序并没有明确的指导方针。
这项新研究成果已发表在期刊《IEEE Access》。该研究指出,要使数据量最小化,这些方法的最佳顺序是IQ,其次是NS和DC。此外,研究人员还创建了一种算法,可以自主确定每种方法的应用比例,无需反复试验。
该算法可将卷积神经网络压缩到比之前的模型小28倍,速度提高76倍。这项研究通过显著降低计算复杂性、功耗和AI半导体设备的尺寸,有望改变AI图像识别技术。这一突破可能会增强部署先进人工智能系统的广泛可行性。