首页 理论教育 语言与大脑之间的映射

语言与大脑之间的映射

时间:2022-04-19 理论教育 版权反馈
【摘要】:大脑是产生思维和意识的器官,由约140亿个神经元组成。婴儿刚出生时,大脑中神经元之间的树突很少连接,这可以从新生儿脑组织切片中得到证实。这样,在语言空间A与人脑语言中枢空间B之间就建立了一个映射F=B和它的逆映射F-1=A。随着婴儿的成长,不断接受外界的语言刺激,大脑语言区域内的神经网络越来越复杂。

根据现有人类取得的科研成果,我们所掌握的人脑信息如下。

(1)大脑是产生思维和意识的器官,由约140亿个神经元组成。每个神经元可分为胞体、树突和轴突,一个神经元大约有数千个树突,神经元之间借助树突与树突连接成极为复杂的神经网络

(2)大脑中形成的意识、概念、思想是通过语言描述来完成的。大多数事物都用语言来描述,语言是事物描述的代码,这种代码是由特定的社会环境约定俗成的。当人来到这个环境时就自然而然地接受这种代码。例如,孩子出生后首先接触的语言是“妈妈”,妈妈与特定的人相对应。随着孩子的成长,“妈妈”这个词的内涵在不断扩展,比如,妈妈是成年女性,妈妈具有特殊的母爱等。

(3)语言中的信息由视网膜上的视锥细胞、视杆细胞与(或)内耳蜗管基底膜上的毛细胞中转成神经脉冲信号,再由视觉传导路和(或)听觉传导路向上传送,中途几经转换,最后投射到相应的视觉中枢和听觉中枢。在投射过程中,语言信息的载体是神经脉冲信号。

(4)婴儿刚出生时,大脑中神经元之间的树突很少连接,这可以从新生儿脑组织切片中得到证实。当婴儿接受到外界语言刺激后,每一组语言代码与特定的事物相对应,反复地刺激神经元,诱导树突相连接,形成的神经网络在今后的生活中不断改善,最终趋于稳定。当婴儿长到8个月大时,脑组织切片表明神经树突已非常密集。

在这里补充说明一点:一个神经元有许多树突,但只有一个轴突,轴突末端可以分成几个叉,连接后端的神经树突或效应器。轴突末端有突触,突触释放神经递质,神经递质实质上是一些化学物质,如乙酰胆碱去甲肾上腺素等。因此,轴突传导是单向化学传导。树突与树突相连接是膜直接连接,没有突触结构,靠离子双向传导。过去认为,神经元之间的连接只有轴突—树突聚合式连接,即许多神经元最后聚集到少数神经元。其实,神经系统也存在着一个神经元借树突辐射到许多其他神经元的现象,这种连接就是树突—树突连接。

下面笔者使用空间映射的思想对语言、大脑语言中枢神经元树突的网络结构以及它们之间的对应关系提出假设。

南京大学数学学院的苏维宜教授在微分流形的授课中有一段精辟的叙述,她说:“有一个遥远的星体,为了研究它的表面特征,将它的表面设为一个流形,而地球表面设为三维欧氏空间。这个流形上的点与三维欧氏空间上的点一一对应,建立起同胚映射,这样就可以借助研究三维欧氏空间上点之间的关系,间接地研究流形上点之间的关系。”这是多么富有创意的论述。笔者受苏维宜教授思路的启发,将大脑语言区域中相关结构假设为空间B,将某种有文字的语言假设为空间A,在两个空间中建立起一种映射,那么是否可以利用空间A的一些结构特征来研究空间B的一些结构特征呢?下面做进一步的探讨。

婴儿学习语言时是以句子为单位的,这里假设婴儿以英语为母语。设主语为空间A1,谓语为空间A2,宾语(表语)为空间A3。空间A1的一个基为[名词,代词,形容词,动词不定式,动名词,现在分词,过去分词,0],空间A2的一个基为[动词的所有时态和语态组合,0],空间A3的一个基为[名词,代词,形容词,动词不定式,动名词,现在分词,过去分词,0](这里0表示空,例设祈使句为主语空,非及物动词的句子为宾语空)。定语状语、补语、间接宾语等附加在主语、谓语、宾语上,本身不独立,不构成空间。那么,语言空间A可表示为A=A1×A2×A3

假设人脑语言中枢为空间B。空间B的组成单位是以神经元为节点,神经树突为路径组成的神经网络。如果任意两个神经元之间各自有一个树突连接到了一起,可以完成离子传导,就定义为1;任意两个神经元之间各自有两个树突连接到了一起,都可以完成离子传导就定义为2;依次类推……若任意两个神经元树突之间相互无连接,就定义为0。根据图论的知识,我们用神经元代表节点,用树突代表路径,由此,便可得到一个对称方阵(如图2-1所示),e1、e2、e3代表3个神经元和它们与树突之间的连接关系,可得到下面的三阶对称方阵(如图2-2所示)。

图2-1 对称方阵

图2-2 三阶对称方阵

语言中枢系统中的每个神经元有n个树突(n是介于1 000~9 999之间的一个自然数,这是因为神经元有数千个树突)。这样每一个n阶对称方阵就形成一个神经信息编码单位,假设神经信息编码单位是脑功能的基本单位,如同肾小球肾脏功能的基本单位,肝小叶是肝功能的基本单位一样。人脑中语言中枢空间B中的每个神经信息编码单位为一个元素,它们对应着语言空间A中的一个句子。这样,在语言空间A与人脑语言中枢空间B之间就建立了一个映射F(A)=B和它的逆映射F-1(B)=A。

婴儿出生后在外界语言及其对应事物的反复诱导下,我们假设语言中枢中的一些神经元分泌一种促神经元树突生长素a,它促使神经元树突生长,与周围的神经元树突连在一起,形成神经网络,产生了一些神经信息编码单元,这些编码单元与相应的事物和语言对应。随着婴儿的成长,不断接受外界的语言刺激,大脑语言区域内的神经网络越来越复杂。

一个孩子长到了14岁,之前所使用(说、写和译)过的句子,肯定有一些使用的频率很高,而另一些使用的频率很低,那么这些用过的句子频率服从什么样的分布呢?我们不妨将孩子14岁前用过的所有英语句子做成一个语料库进行统计分析,当然这是现实无法做到的。我们使用一个近似的方法,如使用2009年3月至2013年6月慢速英语(VOA)播放过的文章做成一个语料库,看一看其中的词频分布。这意味着用单词替代句子,数学表达式为F(Ai)=B(i=1,2,3),VOA语料库共有1 900篇文章、1 585 980个单词(语料库学称词次)[1],其中出现频率最高的单词是“the”,共出现95 624次,出现频率最低的单词共有2 603个,仅出现1次,其他单词出现频数介于这两者之间。按总单词量出现的频数(语料库学称词型)[2]从低到高向上建立纵坐标,单词出现的频数从高到低排序依次从左到右建立横坐标,得到曲线图(如图2-3所示)。

图2-3 单词出现频数排序图

从上图中可看出,约20%的单词拥有80%的使用频率,其余80%的单词仅有20%的使用频率,这种分布称为幂律分布。

根据空间(Ai,B)对应原则,单词频数分布结果应与大脑语言中枢中神经编码单元的某些特征相对应,合理的解释应该是这样:某个神经元树突与其他神经元树突连接数量多的对应为高频词,反之对应为低频词。即语言中枢中20%神经编码单元表达式为n阶对称方阵中拥有大于或等于1元素的比例高,剩下的80%拥有0的元素比例高,服从幂律分布。

这个假定从感性上可以证实:使用常用词回忆的时间短(高频词检索时间短),罕用词回忆时间长(低频词检索时间长),即高频词检索路径多,低频词检索路径少。

这种情况与互联网的某些特征类似,在互联网上少量路由器拥有大量的路径(集散节点),多数路由器拥有少量路径(在神经编码单元中2个节点之间的路径有时大于1,这点与互联网不同)。这种网络称为无标度网络(Scalefree)[3],这种网络的致命点是当计算机病毒或黑客攻击这些少数拥有众多路径的路由器时,会造成大范围网络瘫痪。反之,多个非集散节点同时受到攻击则无关紧要。

联想到脑部损伤或病变,在临床上我们常常发现,有些脑梗死患者,脑CT片表明梗死范围不大,患者却出现严重的失语症;而另一些患者,脑CT片表明梗死范围很大,而患者仅出现轻微语滞。这恐怕是与梗死部位的神经元拥有与其他神经元连接的树突数密切相关,而与损伤或病变的体积大小关系不大。

【注释】

[1]桂诗春.基于语料库的英语语言学语体分析[M].北京:外语教学与研究出版社,2009:25.

[2]桂诗春.基于语料库的英语语言学语体分析[M].北京:外语教学与研究出版社,2009:25.

[3]王林,戴冠中.复杂网络的Scale-free性、Scale-free现象及其控制[M].北京:科学出版社,2009:58.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈