人脑比其他声音更及时地跟踪语音
人类可以毫不费力地识别自然声音并对其做出反应,尤其适合于语音。已经进行了几项旨在定位和理解大脑语音特定部分的研究,但是由于同一大脑区域大部分对所有声音都活跃,因此,尚不清楚大脑是否具有独特的语音处理过程以及如何进行语音处理。它执行这些过程。主要挑战之一是描述当两者之间没有一对一的对应关系时,大脑如何将高度可变的声音信号与语言表示相匹配,例如,大脑如何识别说话者和方言所使用的相同单词,相同。
在这项最新研究中,由Riitta Salmelin教授领导的研究人员从16位健康的芬兰志愿者的毫秒级大脑记录中解码并重建了语音。他们采用了一种新颖的方法,即利用多种声音的自然声学可变性(由不同说话者说出的单词,来自多个类别的环境声音),然后使用生理学启发的机器学习模型将它们映射到脑磁图(MEG)数据。这些类型的模型具有声音的时间分辨和时间平均表示,以前已经在大脑研究中使用。共同首席作者阿里·费萨尔(Ali Faisal)提出的新颖,可扩展的公式允许将此类模型应用于全脑录音,并且这项研究是首次比较相同模型的语音和其他声音。
阿尔托研究人员和主要作者安妮·诺拉(Anni Nora)表示:“我们发现,将皮质激活物的时间锁定与正在展开的语音输入相连接对于语音编码至关重要。当我们听到一个单词,例如“猫”时,我们的大脑必须及时非常准确地跟随它才能理解其含义。
相比之下,在非语音环境声音的皮质处理中未突出显示时间锁定,该声音传达了与口语相同的含义,例如音乐或笑声。相反,时间平均分析足以达到其含义。``这意味着当您听到猫的叫声时,大脑也会访问相同的表示形式(猫的样子,猫的行为,感觉等),但是声音本身会作为一个整体进行分析,不需要诺拉解释说。
对于无意义的新单词,也观察到了时间锁定编码。但是,即使是对诸如笑声之类的非语音非人为声音的响应,也都无法通过动态时间锁定机制显示出更好的解码效果,并且可以使用时间平均模型更好地进行重构,这表明时间锁定编码对于识别出的声音来说是特殊的。作为演讲。
结果表明,大脑反应在语音之后具有特别高的时间保真度
当前的结果表明,在人类中,一种特殊的时间锁定编码机制可能已经演变为语音。根据其他研究,在早期开发过程中,这种处理机制似乎已针对母语进行了调整,并广泛暴露于语言环境中。
时锁编码的当前发现,尤其是语音的发现,加深了对声学和语言表示(从声音到单词)之间映射所需的计算的理解。当前的发现提出了一个问题,即声音中的哪些特定方面对于提示大脑使用这种特殊的编码模式至关重要。为了对此进行进一步调查,研究人员接下来的目标是使用诸如听觉环境之类的现实生活,例如重叠的环境声音和语音。诺拉说:“未来的研究还应确定是否可以通过经验处理类似的时间锁定,并专门处理经验,例如处理音乐家的乐器声音。”
未来的工作可能会调查语音声学中不同属性的贡献以及实验任务可能会产生的效果,以促进在声音处理中使用时间锁定或时间平均模式。当将这些机器学习模型应用于临床组时,例如对语音处理受损的个人进行调查时,它们也可能非常有用。