家长帮-生活百科-科幻频道

　　对于人类来说，可能自然而然也存在这样的“偏爱”，比如偏爱形状，因为当我们看到一件东西，想确定它是什么时，靠形状判断是最有效的方式，即使环境中有许多干扰，同样如此。人类生活在3D世界，可以从多个角度观察，我们还可以借助其它感知（比如触觉）来识别对象。所以说，人类偏爱形状胜过纹理完全合理。

　　德国图宾根大学研究人员Felix Wichmann认为，这项研究告诉我们数据产生的偏见和影响远比我们认为的大得多。之前研究人员也曾发现相同的问题，例如，在面部识别程序、自动招聘算法及其它神经网络中，模型过于重视意料之外的特征，因为训练算法所用的数据存在根深蒂固的偏见。想将这种不想要的偏见从算法决策机制中剔除相当困难，尽管如此，Wichmann认为新研究证明剔除还是有可能的。

　　虽然Geirhos的模型专注于形状，不过如果图像中噪点过多，或者特定像素发生变化，模型仍然会失败。由此可以证明，计算机算法离人类视觉还有很远距离。在人类大脑中，可能还有一些重要机制没有在算法中体现出来。Wichmann认为，在某些情况下，关注数据集可能更重要。

　　多伦多大学计算机科学家Sanja Fidler认同此观点，她说：“我们要设计更聪明的数据和更聪明的任务。”她和同事正在研究一个问题：如何给神经网络分派第二任务，通过第二任务让它在完成主任务时有更好表现。受到Geirhos的启发，最近她们对图像分类算法进行训练，不只让算法识别对象本身，还让它识别对象轮廓（或者形状）中的像素。

　　结果证明，执行常规对象识别任务时，神经网络越来越好，自动变得越来越好。Fidler指出：“如果指派单一任务，你会特别关注某些东西，对其它视而不见。如果分派多个任务，也许能感知更多。算法也是一样的。”当算法执行多个任务时，它会关注不同的信息，就像Geirhos所做的“形状纹理”实验一样。

　　美国俄勒冈州立大学计算机科学家Thomas Dietterich认为：“这项研究是一个激动人心的突破，深度学习到底发生了什么？我们对此有了更深的理解，也许研究还能帮助我们突破极限，看到更多东西。正因如此，我很喜欢这些论文。”

　　编者：小兵手

本文来自： 36氪

AI图像识别：人类看的是形状，算法看的是纹理

请点彩色字转发，谢谢！