日前,国外媒体撰文称,大脑活动对于人类来说太难理解,我们需要借助机器和人工智能的力量。
在过去的几年里,杰克·格朗特(JackGallant)的神经科学实验室发表了一连串听上去荒谬至极的研究论文。
年,该实验室证明,光通过观察人在看电影时的大脑活动来再创造电影片段是可行的。仅通过扫描人在看电影式的大脑活动,计算机就能再生成电影的画面,从某种意义上说这是读心。类似地,年格朗特的科学家团队通过观察大脑活动来预测人们在想象哪一幅名画。
今年,该团队在《自然》(Nature)杂志中宣布,他们制造了有关1万个以上的独立单词处在大脑什么位置的“地图集”——仅仅通过研究在听播客的参与者,来做到这一点。
他们是怎么做到这一切的呢?通过使用机器学习(一种人工智能技术)工具来分析海量的大脑数据,发现大脑活动的模式来预测我们的感知。
他们的目标并不是打造一个读心机器。神经科学家们无意从你的大脑窃取你的银行账户密码。他们也无意知道你隐秘的阴暗想法。他们的真正目标要宏大得多。通过将数据科学转变成一门“大数据”科学,以及利用机器学习来挖掘那些数据,格朗特和该领域的其他研究人员有潜力彻底改变我们对大脑的理解。
毕竟,人类的大脑是整个宇宙中最复杂的东西,我们对它无甚了解。格朗特实验室的疯狂想法是一个有可能会让神经科学走出初期发展阶段的想法,它就是:也许我们必须得打造机器来理解我们自己的大脑。他们的希望在于,如果我们能够解读错综复杂的大脑,那当大脑遭受疾病的时候,我们就能够知道如何修复它。
功能性磁共振成像(fMRI)——我们当前用来分析大脑功能及其剖析图的主要工具——在年代才出现,而它能够带给我们的有用信息也非常有限。
具体来说,fMRI能够检测的大脑活动的最小单位被称为体素。通常来说,这些体素的体积要小于1立方毫米。一个体素中可能有10万个神经细胞。德克萨斯大学神经科学家塔尔·雅科尼(TalYarkoni)如是说,看fMRI图像“就像是在空中俯瞰城市,看到哪里的灯是亮着的。”
传统的fMRI图像能够显示对特定行为很重要的宽泛区域在哪里——例如,你可以看到我们是在哪里处理负面情绪,又或者看到当我们看到熟悉的面孔时,大脑的哪些区域会亮起来。
然而,你无法确切知道那一区域在行为中具体扮演什么角色,也无法知道其它不那么活跃的区域是否也扮演重要的角色。大脑并不像各个单元都有着特定功能的乐高积木,它是一个活动网格。“大脑的每一个区域都有50%的概率与大脑中任何其它的区域关联。”格朗特说道。
正因为此,简单的实验——鉴别大脑的“饥饿”区域或者“警觉”区域——无法产生真正令人满意的结论。
“过去14年,我们一直在研究这些大脑活动斑点,以为所有的信息都包含在里面——就这些斑点。”美国国家心理卫生研究所fMRI方法部门主管彼得·班德蒂尼(PeterBandettini)表示,“结果发现,斑点的每一个细微差别,起伏的每一个细微差别,都包含有关我们大脑活动的信息,我们还无法完全挖掘这些信息。因此,我们需要机器学习技术。我们的眼睛能看到斑点,但无法看到活动模式。那些模式实在太复杂了。”
举例来说,对于大脑如何处理语言的传统观点是,它发生在大脑的左半球,两个特定区域(布若卡氏区和韦尼克氏区)是语言活动的中心。如果那些区域受损,你就无法产生语言。
但格朗特实验室的博士后阿莱克斯·胡思(AlexHuth)最近证明,那种理解过于简单了。他想要知道是否整个大脑都参与语言的理解。
在实验中,他让数位参与者听两个小时的故事播客TheMoth,在此期间,他和同事用fMRI扫描器来记录参与者的大脑活动。他的目标是,将听单个词语的活动与大脑活动的独特区域关联起来。
格朗特说,该实验产生了许多的数据,多到人工无法处理的程度。但接受过发现模式训练的计算机程序能够处理那些数据。胡思设计的程序能够生成一个展示每个单词“生活于”大脑哪个位置的“地图集”。
格朗特说,“胡思的研究表明,大脑很大的一部分都参与了语义理解。”胡思还证明,意思相近的单词——如“poodle”(狮子狗)和“dog”(狗)在大脑中的位置相邻。
那么,像这样的项目有什么意义呢?在科学当中,预测就是力量。如果科学家能够预测令人昏乱的大脑活动如何转化成语言理解,那他们就能够就大脑如何运作建立一个更好的模型。如果他们能够建立一个可行的模型,那他们就能够更好地理解当变量改变(即大脑生病)的时候究竟发生了什么。
什么是机器学习?
“机器学习”是一个广义的、包括巨大软件阵列的术语。在消费级技术中,机器学习技术正在飞快地加速发展——例如,学习如何“看到”照片中的物体的能力已经接近人类的水平。借助名为“深度学习”的机器学习技术,谷歌翻译服务已经从一款普通的基础翻译工具,变成了一个能够将海明威小说翻译成多种语言,且水平不逊于专业人员的机器。
但从根本上说,机器学习程序就是寻找模式——X变量与Y有关联的可能性有多大。
机器学习程序通常都需要先接受数据集“训练”。在训练中,这些程序会寻找数据里的模式。通常来说,训练数据越多,这些程序就会变得越“智能”,越精确。完成这些训练后,机器学习程序会接收它们之前从未见过的、全新的数据集。有了那些新数据集,它们就能够开始做出预测。
一个简单的例子就是你邮箱中的垃圾邮件过滤器。机器学习程序扫描过足够多的垃圾邮件——学习它们包含的语言模式——就能够判断新邮件是否是垃圾邮件。
机器学习可以是只是计算数学问题的简单程序;又或者是像谷歌DeepMind那样,吸收数百万个数据点。机器学习也解释了为什么谷歌能够打造出计算机来在像围棋这么复杂的游戏中击败人类世界冠军李世石。围棋拥有的潜在走法数量比宇宙中的原子数量还要多。
神经科学家正将机器学习拥有几个不同的目的,其中包括两个基本的目的:编码和解码。
通过“编码”,机器学习技术尝试预测刺激物会产生的大脑活动的模式。
“解码”则恰恰相反:观察大脑活动的区域,预测参与者在看什么。
(注:除了fMRI以外,神经科学家还可以在其它的脑部扫描形式上使用机器学习技术,如脑电图EEG和MEG。)
俄勒冈大学神经科学家布莱斯·库尔(BriceKuhl)最近利用解码仅依靠fMRI数据来重构参与者在观看的面孔。
库尔在MRI图像中锁定的大脑区域长期以来被认为与鲜活记忆有关。“那个区域是不是代表你所看到的东西的细节——又或者只是因为你对那个记忆有信心而亮起来?”库尔说道。机器学习程序能够依据那个区域的大脑活动来预测面孔特征,这表明那是“你所看到的东西的细节”信息所在的地方。
类似地,格朗特预测参与者在想象什么名画的实验揭示了心智的一个小秘密:我们所激活的大脑区域,跟我们亲眼看到那些名画,记忆视觉特征时所激活的大脑区域是一样的。
记者采访的神经科学家都认为,机器学习目前还不能显著改变他们的研究领域。一大原因就是,他们没有足够多的数据。大脑扫描需要很多的时间,且成本高昂。另外,目前的研究通常仅使用几十个参与者,而不是数千个。
“在年代,神经影像才刚刚开始流行,当时人们