AI图像识别:人类看的是形状,算法看的是纹理

  对于人类来说,可能自然而然也存在这样的“偏爱”,比如偏爱形状,因为当我们看到一件东西,想确定它是什么时,靠形状判断是最有效的方式,即使环境中有许多干扰,同样如此。人类生活在3D世界,可以从多个角度观察,我们还可以借助其它感知(比如触觉)来识别对象。所以说,人类偏爱形状胜过纹理完全合理。

  德国图宾根大学研究人员Felix Wichmann认为,这项研究告诉我们数据产生的偏见和影响远比我们认为的大得多。之前研究人员也曾发现相同的问题,例如,在面部识别程序、自动招聘算法及其它神经网络中,模型过于重视意料之外的特征,因为训练算法所用的数据存在根深蒂固的偏见。想将这种不想要的偏见从算法决策机制中剔除相当困难,尽管如此,Wichmann认为新研究证明剔除还是有可能的。

  虽然Geirhos的模型专注于形状,不过如果图像中噪点过多,或者特定像素发生变化,模型仍然会失败。由此可以证明,计算机算法离人类视觉还有很远距离。在人类大脑中,可能还有一些重要机制没有在算法中体现出来。Wichmann认为,在某些情况下,关注数据集可能更重要。

  多伦多大学计算机科学家Sanja Fidler认同此观点,她说:“我们要设计更聪明的数据和更聪明的任务。”她和同事正在研究一个问题:如何给神经网络分派第二任务,通过第二任务让它在完成主任务时有更好表现。受到Geirhos的启发,最近她们对图像分类算法进行训练,不只让算法识别对象本身,还让它识别对象轮廓(或者形状)中的像素。

  结果证明,执行常规对象识别任务时,神经网络越来越好,自动变得越来越好。Fidler指出:“如果指派单一任务,你会特别关注某些东西,对其它视而不见。如果分派多个任务,也许能感知更多。算法也是一样的。”当算法执行多个任务时,它会关注不同的信息,就像Geirhos所做的“形状纹理”实验一样。

  美国俄勒冈州立大学计算机科学家Thomas Dietterich认为:“这项研究是一个激动人心的突破,深度学习到底发生了什么?我们对此有了更深的理解,也许研究还能帮助我们突破极限,看到更多东西。正因如此,我很喜欢这些论文。”

  编者:小兵手

本文来自: 36氪


科幻频道 footer