最新计算机神经网络识别图像达灵长类动物水平
——有助于开发更好的人工智能,也可用于研发修复视觉机能障碍的新方法
科技日报讯 几十年来,神经科学家致力于设计计算机网络来模拟人类的视觉能力,如认知目标,大脑在这方面精确而迅速,一瞥之间就能认出所见之物。还没有一个计算机模型在识别视觉目标上与灵长类动物的大脑相比。
据物理学家组织网近日报道,美国麻省理工大学神经科学家的一项最新研究发现,最新一代的所谓“深度神经网络”能比得上灵长类动物的大脑。这提高了人们对灵长类大脑工作原理的理解,有望开发更好的人工智能,带来修复视觉机能障碍的新方法,相关论文发表在最近的《公共科学图书馆·计算生物学》上。
新研究指出,目前最好的网络是纽约大学开发的一种模型,在对目标分类识别上能达到猕猴大脑的水平。论文高级作者、MIT脑与认知科学系神经科学教授詹姆斯·狄卡罗说,最新网络的成功表明,神经科学家已相当准确地掌握了目标认知原理。“模型能预测神经反应和物体在神经丛空间的距离,概括了我们迄今最好的理解,让我们知道那些以往神秘的脑区发生了什么。”
早在上世纪70年代,科学家就开始构建神经网络。受大脑分级处理视觉信息的启发,构建了视觉神经网络模型。他们在模型中构造出多个计算层,每层执行一步数学运算。在每一层,图像目标的表达越来越复杂,无关的信息被放到一边。“每个元素都是非常简单的数学式,”论文第一作者、MIT麦戈文研究所博士后查尔斯·卡迪欧说,“但千百万这些元素结合在一起,从原始信号到用于目标识别的表达式之间就形成了极复杂的转换。”
研究人员首先检测了大脑的目标识别能力。他们颞下(IT)皮层和V4脑区植入了电极阵列。再把这些和深度神经网络生成的表达进行对比,深度神经网络由系统中每个计算元素生成的数字矩阵构成。每幅图像会产生一个不同的数组。模型的精确性取决于能否把相似的对象归类到相似的表达集群。
卡迪欧说,这种神经网络最近取得的成功,取决于两个主要因素:一是计算处理能力,尤其是图形处理单元(GPUs)方面的巨大进步;第二是研究人员能访问大型分类数据库,用数据来“训练”算法。最初,神经网络并不能很好地识别这些图像,但随着它们看的图像越来越多,不断发现错误,精简算法,最终它们对目标物体的识别会变得越来越精确。
目前,狄卡罗实验室打算开发其它模型,模拟图像处理的更多方面,包括跟踪运动、识别三维形状,人类视觉系统中的“反馈”预测等。现有网络只能模拟从视网膜到IT皮层的“前馈”预测,而从IT皮层返回到其余系统的连接是前馈连接的10倍。(常丽君)
|