计算机学人脑看图识物


  看一张图就能知道图片中是什么东西,这对人脑来说再轻松不过了。但是,如果让计算机看图就能识别物体就难多了。

  来自美国洛斯阿拉莫斯国家实验室(Los Alamos National Laboratory)、查塔姆大学和艾莫里大学的研究人员做了一个实验来测量人类处理视觉任务时的表现。他们让一张图片在非常短的时间内(20~200毫秒)在实验者的眼前闪过,和预期一样,他们发现在如此短的时间内人类识别图片中物体的表现更糟。

  现在该团队试图教计算机来识别图片中的形状,并且要比人类识别快得多。他们尝试开发一款基于人类神经结构和功能的计算机模型,来完成人类做的任务,并且可能比人类完成的更好。

  该模型受到生物学上的启发,利用人类视觉系统模型同层之间的神经细胞间的侧面连接(lateral connections)来实现,查塔姆大学的瓦达斯·吉塔塔斯(Vadas Gintautas)说到。他之前是洛斯阿拉莫斯国家实验室的研究员。

  当特定物体处于可视状态时,这些位于下颞叶皮质(inferotemporal cortex)的神经细胞可以激活,不管物体有多远或物体如何被摆放。这一现象被称为“视觉不变性”(viewpoint invariance)。当然,大脑在检测和识别特种事物方面有着神奇的能力,即使这些事物勉强能被看见。但现在的挑战在于如何让计算机做同样的事情。对计算机编程,让其像大脑一样处理信息可能是沿着正确方向迈出的重要一步。

  吉塔塔斯表示,在解决类似任务的类似模型中,侧面连接一直被忽视。他们的模型从品质来讲是可以仿造人类处理同样任务上的表现,不管是时间方面还是难度方面。尽管这不能保证人类视觉系统用同样的方式使用横向连接来解决这项任务,但该模型在处理物体检测方面确实打开了一条新通道。

  在最近发布的成果中,该团队模仿了皮层边缘检测器之间的侧面连接,以确定这样的连接是否能解释人类轮廓感知的难度和时间进程。这项研究利用美国国家科学基金会的神经模拟工具箱(PetaVision),将皮质回路(cortical circuits)的高性能计算机模拟结果连同人类轮廓感知的生理心理测量值结合在一起。最终结果发现,模拟人脑结构可以帮助计算机识别物体,研究人员正努力让计算机的表现更好。

  该研究成果于今年秋季发表在《科学公共图书馆》(PLoS)的“计算生物”栏目上。