首页 理论教育 早期联结学习理论与实验

早期联结学习理论与实验

时间:2022-03-03 理论教育 版权反馈
【摘要】:1898年桑代克发表了题为《动物的智慧》一文,并由此推动了学习心理学的诞生。桑代克所用“联结”一词不过用以表示某一情境将为某一反应所跟随的几率。桑代克对教育心理学的主要贡献是阐明了效果律。在桑代克的实验中,为了保证学习的发生,猫必须处于饥饿状态。

第一节 早期联结学习理论与实验

一、桑代克的联结学习理论与实验

1898年桑代克(E.L.Thorndike)发表了题为《动物的智慧》一文,并由此推动了学习心理学的诞生。桑代克是美国当之无愧的“教育心理学鼻祖”[1],他所做的猫学习逃出迷箱的实验至今仍是极其著名的经典实验。桑代克认为学习就是刺激—反应(S—R)的联结,刺激—反应联结可以被加强,也可以被削弱,学习过程主要是一种尝试—错误(trial-and-error)的过程。

(一)经典实验

在桑代克的经典实验中,一只饿猫被关在如图4-2所示的箱子里。这个箱内设有一种开门闩的装置:一条绳子,一个把柄,一个握手。当动物操作这些装置时,门户洞开,它就逃出箱外,获得正放在箱外的食物。依照桑代克的分析,迷箱的内部构成了“刺激情境”,动物对此刺激情境能使出浑身解数,尝试各种可能的行为或反应,试图逃出箱来。最初几次尝试的一般特点是:起先几分钟内总是出现大量无关的、不成功的行为,即多次的抓、咬、擦、叫、四处乱窜和紧抓箱顶的动作,然后以似乎是“偶然”的方式使门闩绊倒。动物做出正确反应并逃出来之前所花费的时间量便是它在一次尝试中被记录的作业成绩。起初,动物费时甚多,因为它有许多任意的、无关的行为。不过随后进行的尝试费时渐少,但这种变化是缓慢而不规则的。

img9

图4-2 桑代克迷箱

(二)桑代克联结学习理论的基本观点

桑代克根据动物实验研究,提出了一个系统的学习理论——联结学习理论,其主要观点如下。

1.学习的实质

学习的实质在于形成刺激—反应联结(无需观念作媒介),学习的过程是尝试与错误的渐进过程。在上述实验中,猫通过多次尝试与错误在复杂的情景中辨别出门闩(S)作为打开门的刺激,也就是说门闩(S)与开门反应(R)形成了巩固的联系,这就是学习。桑代克认为:“学习就是联结,心即人的联结系统”;“所谓联结,即指某情境仅能唤起某种反应的倾向而言”;“假如有某一情境(简称为S1)出现在某人的生活中,此人所能做出的反应可能有千万种,但非个个都有同样出现的机会。S1常常有一种明显的倾向,仅能唤起某一反应,或少反应其中的某一个。”这就是学习的结果。桑代克所用“联结”一词不过用以表示某一情境将为某一反应所跟随的几率。如果不称之为联结,而称绾结、关系或倾向等,均无不可[2]

桑代克认为这种学习结果并不意味着,猫真正“明了”或“领悟”到逃脱的方法,它是通过逐渐铭记正确反应和逐渐消除不正确反应的印迹而学会的。所以学习就是刺激与反应的联结,即S—R之间的联结,每个刺激—反应联结都先是错误反应多于正确反应,而后逐渐变为正确反应多于错误反应,最后达到全部正确而无错误反应,这种学习过程称为尝试与错误过程,因此,桑代克的学说又被称为“试误说”。

2.学习的法则

在试误学习中,刺激—反应联结能否建立,主要遵循三大法则。

(1)效果律(law of effect)。桑代克对教育心理学的主要贡献是阐明了效果律。效果律指“在对同一个情景做出的若干反应中,那些伴随着或紧接着使动物满意的事态发生的反应,在其他条件相等的情况下,将与这个情景更加牢固地联结起来……那些伴随着或紧接着使动物不适的事态发生的反应,在其他条件相等的情况下,将与这个情景的联结削弱下去”[3]。换言之,刺激—反应之间联结的加强或减弱受到反应结果的影响,喜悦的结果加强联结,厌烦的结果减弱联结。因此,有无奖励、成功和失败是选择更合适反应的机制。例如,如果猫逃出迷箱后得到的是惩罚而不是奖励,那么猫就不会再试图跑出迷箱了。桑代克的这一原则——即根据反应成功与失败或所受到的奖惩来选择更合适的行为原则,与通过成功的适应进行的自然选择或适者生存机制一致,适者生存是达尔文物种进化理论的基础,显然,桑代克深受达尔文进化论适者生存观点的影响。

(2)准备律(law of readiness)。准备律包括三个组成部分:①学习者准备行动时,给以行动则产生满意的结果;②学习者准备行动时,不让其行动,将会产生烦恼的结果;③学习者不准备行动时,强迫其行动,将会产生烦恼的结果。在桑代克的实验中,为了保证学习的发生,猫必须处于饥饿状态。如果猫吃得太饱,把它放进迷箱后,它很可能没有任何学习逃出迷箱的行为,而是悠闲地蜷缩在笼中。所以,学习者是否对某种刺激做出反应,同它是否已经做好准备有关。又如,一个孩子打开冰箱去取冰淇淋,求食的愿望使这个行动进入准备状态。准备律后来演变成学习的动机原则。

(3)练习律(law of exercise)。练习律是指刺激—反应联结的强度决定于使用联结的频率,换言之,反应重复的次数越多,刺激—反应的联结就越牢固。我们常说的“业精于勤”、“熟能生巧”就是这条定律的说明。练习律由用律(law of use)和废律(law of disuse)两部分组成。桑代克认为,一个已形成的刺激—反应联结,若加以应用,这种联结的力量便会加强,这称之为用律;一个已形成的刺激—反应联结,因练习次数中断或不加以应用,这种联结的力量便会减弱,这称之为废律。桑代克的练习律包含了后来行为主义强化理论的主要内容。

桑代克根据动物实验构建了系统的学习理论,现代心理学家波斯曼(1962)指出:“桑代克在五十年前所描绘的学习过程的概貌,现在仍然大量编入书中。任何有关人类学习的综合理论都不能无视桑代克留给我们的遗产。”巴甫洛夫也说道(1928):“用我们的新方法开始研究工作若干年之后,我才知道多少有点类似的实验在美国已有人做了,并且确实不是由生理学家而是由心理学家做的。随即我更详细地研究美国的出版物,现在我必须承认,沿着这条路走出第一步的荣誉是属于桑代克的。他的实验先于我们的实验二年或三年,同时他的著作《动物的智慧》无论就它对一项巨大任务提出的大胆看法来说,还是就它的研究结果的精确性来说,都应被看做一部经典著作。”桑代克的联结主义思想,改变了多年来联想主义思想的传统。传统的联想主义所指的是观念间的联想,桑代克的联结主义所指的是刺激—反应的联结。后来华生行为主义学派所主张的刺激—反应行为联结,就是以桑代克的联结主义为蓝本的,此外,他的效果律对新行为主义者斯金纳的思想影响很深,斯金纳的操作条件作用就是以他的效果律为基础的[4]

二、巴甫洛夫的条件反射学习理论与实验

巴甫洛夫是前苏联著名的生理学家,由于他在消化生理学方面的突出贡献,1904年获得诺贝尔奖,在他余后的生涯中,兴趣发生了变化,从消化生理研究转向对狗的观察。巴甫洛夫注意到他用来做实验的狗,不仅当食物直接放在它嘴边时会分泌唾液,而且在此之前,如当它听到训练员上楼梯的脚步声时,就开始分泌唾液了,巴甫洛夫由此认为,动物存在着两种反射:一种是生理反射,这是一种内在的、任何动物的所有成员都会表现出来的反射;另一种是心理反射,这种反射是特定动物作为特定经验的结果而产生的,后来巴甫洛夫用“条件反射”这一术语来描述这种心理反射(在巴甫洛夫的著作中,都将狗的唾液分泌称为反射,后来美国心理学家采用其理论后,多以“反应”取代“反射”)。如当所有的狗在食物放入嘴里时,都会分泌唾液,但只有那些具有某种经验的狗才会在听到铃声时产生分泌唾液的活动。

桑代克的联结主义所指的是刺激—反应的联结。后来华生行为主义学派所主张的刺激—反应行为联结,就是以桑代克的联结主义为蓝本的,此外,他的效果律对新行为主义者斯金纳的思想影响很深,斯金纳的操作条件作用就是以他的效果律为基础的[5]

(一)经典实验

巴甫洛夫把狗用一副套具固定住,唾液是用联结在狗颚外侧的管道收集的,管道联结到一个既可以测量以立方厘米计的总量,也可以记录分泌的滴数的装置。当狗嘴里有食物时,会产生分泌唾液的反应,这种反应是本能固有的,巴甫洛夫把这种食物称为无条件刺激,简称“UCS”,把反射性唾液分泌称为无条件反射,简称“UCR”。为了使狗对某一种刺激(如铃声)形成条件作用,把这种原来只会引起探索性反射的中性刺激(铃声)与无条件刺激(肉)配对。经过一系列配对尝试后,单是发出铃声,不提供肉,也能引起狗产生唾液分泌。在这种情况下,铃声就成了条件刺激,简称“CS”,铃声引起的唾液分泌就是条件反射,简称“CR”。由此可见,条件反射仅仅是由于条件刺激与无条件刺激配对呈现的结果。

(二)经典条件学习理论的基本观点

1.学习的实质

学习就是形成条件反射。一个原是中性的刺激与一个原来就能引起某种反应的刺激相结合,而使动物学会对那个中性刺激做出反应,这就是经典条件反射的基本内容。中性刺激与无条件刺激在时间上的结合成为强化,强化的次数越多,条件反射就越巩固。

2.条件反射的形成过程

条件反射的形成过程涉及四个变量,两个自变量——无条件刺激与条件刺激,两个因变量——无条件反应和条件反应。按照控制自变量观察记录因变量的实验设计程序,采用表4-2的安排,即可获得条件反应。因此表4-2的实验程序,即可视为经典条件反射的形成过程。

表4-2 经典条件反射形成过程

img10

需要指出的是,由于巴甫洛夫的无条件刺激(UCS)与桑代克的强化刺激(S')呈现的时间和所起的作用不同,前者可以说是一种刺激辨别学习,后者则是通过强化刺激加强刺激—反应的联结。

3.经典条件反射中的行为法则

一个原是中性的与某种反应无关的刺激与一个原来就能引起某种反应的刺激结合,而使动物学会对中性刺激做出反应,这就是经典条件反射的基本内容。经典条件反射的主要特点是:其一,学习者行为的持续变化是其经验的结果;其二,对刺激的反应是一种情感的、心理的、不随意的反应,也就是说,这些条件反应是不受学习者意识控制的;其三,原本无任何关系的条件刺激和无条件刺激变得有关联了,如巴甫洛夫的实验助手与食物联系起来了;其四,条件反应与无条件反应完全相同或相似,如在巴甫洛夫的实验中,它们是相同的。综合经典条件反射的实验研究,以下几种现象是最常见到的,这些现象已成为以后解释有关条件反应的一般法则。

(1)泛化与辨别。泛化(generalization)是由与条件刺激类似的刺激引起的,即指某一条件反射一旦形成后,与条件刺激类似的其他刺激会独自引发条件反应。如一位学生数学考试屡遭失败,久而久之建立起一种一遇到数学考试就会焦虑的条件反射,到后来参加化学考试,他也会产生焦虑,即使他以前的化学成绩并不差,这就是泛化现象。就一般而言,刺激与原来的条件刺激越相似,引发条件反应的可能性就越大。在这个例子中,自然科学与数学有联系,所以化学考试与数学考试刺激相类似,而引发了条件反应——焦虑。

与泛化相反的现象是辨别(discrimination),这是一种对有关的但又不完全一样刺激给予不同反应的能力。例如,在上例中,这位学生会对化学考试产生焦虑,但是他对英语和历史考试却并不焦虑,这就是辨别,他能辨别英语考试和数学考试的不同,而给予不同的反应。显然,泛化是趋同,辨别是趋异,两者交互学习,才能构成准确精密的学习。

(2)消退。消退(extinction)这一现象发生在条件刺激多次重复出现而不伴随无条件刺激时,原已形成的条件反射就逐渐减弱直至消失,即条件刺激不再引起条件反应。例如,在巴甫洛夫的实验中,对已形成听到铃声(条件刺激)就分泌唾液(条件反应)的条件反射的狗,只给铃声而不伴随出现食物,多次反复后,那么铃声引起唾液的分泌量将逐渐减少直至不再分泌唾液,这就是条件反射的消退现象。但是,条件反射的消退并不意味着条件刺激和相应的条件反应完全消失,或再也没有了。相反,在过了一段时间后,条件反射会自然恢复,但这种自然恢复是不完全的,即不可能达到原来的强度。

(3)高级条件作用。已经形成条件反射后,所采用的条件刺激可以充当无条件刺激,与另一个条件刺激配对,形成一个新的条件反射,这称为二级条件反射,依此类推,还可形成更多更高级的条件反射,那就称为高级条件反射(higher-order conditioning)。

三、华生的行为习惯说理论与实验

华生(J.B.Watson)1913年发表了《行为主义者心目中的心理学(Psychology as the behaviorist view it)》,文中阐明了他的行为主义观点——“我们所需要做的是在心理学中从头工作,把行为而不是把意识当作我们研究的客观对象。”[6]这被视为行为主义诞生的宣言书。华生是把巴甫洛夫的研究结果作为学习理论的基础的第一人,他认为巴甫洛夫的条件反射是研究行为的开端,所谓学习就是以一种刺激替代另一种刺激,把条件刺激与条件反应组织起来,建立条件反射的过程,也可以说是行为习惯形成的过程。

(一)经典实验

华生强调,要用刺激—反应来分析所有的行为,包括情绪反应。为此,华生与雷纳(Watson and Rayner,1920)进行了一项称之为“小艾伯特(Little Albert)”的实验[7]。小艾伯特是日托中心的一个健康、正常的幼儿,当时他只有11个月又5天。条件刺激是一只小白鼠。小艾伯特最初的反应是好奇。他看着它,似乎想用手去触摸它。无条件刺激是用铁锤敲击一段钢轨发出的声音。这显然是一种令人生厌的声音,因为小艾伯特的无条件反应是惊怕、摔倒、哭闹和爬开。在白鼠与敲击钢轨的声音一起出现3次后,光是白鼠就会引起害怕和防御的行为反应。在6次条件作用后,小艾伯特见到白鼠时会产生强烈的情绪反应。在小艾伯特1岁又21天时,华生进行了一系列泛化测验,即在小艾伯特面前呈现小白兔、小白狗和白色裘皮大衣等。在每一种情况下,小艾伯特都表现出一种很强的情绪反应,类似于对白鼠的反应。接下来,华生探讨了用来消除小艾伯特恐惧情绪的种种可行的办法。但不幸的是,小艾伯特在接受可能的治疗之前,离开了日托中心,举家迁徙到别的地方去了。华生认为,这项实验表明,小艾伯特的条件情绪反应将会在相当长一段时间里存在。

这是一个用条件反射的原理形成恐惧的实验,在条件反射形成之前,小孩接近白鼠毫无害怕的表现。后来,白鼠出现后,紧接着就出现一个使小孩害怕的响声,形成条件反射后,只是白鼠出现也能使小孩害怕,最严重时,孩子会对任何有毛的东西感到害怕,如兔子、制成标本的动物,甚至有胡子的人。因为一种动物和一种引起恐惧的刺激产生了联系,孩子产生了对那种动物的恐惧,而以白鼠为条件的恐惧,最后泛化到相似的刺激。

(二)行为习惯说的基本观点

华生的学习理论,在一定程度上是建立在抨击桑代克效果律基础上的。在他看来,桑代克的效果律是心灵主义的,只不过是陈旧的享乐主义原则的翻版而已。为了从实验上推翻桑代克的理论,华生训练白鼠为达到目的箱吃到食物,必须先挖沙子。白鼠挖沙子到达目的箱后,不立即喂食,而是让它在那里空等一会。华生认为,根据桑代克的理论,强化增强的是强化之前的刺激—反应联结。在这个实验中,空等是较后的反应,而挖掘沙子到目的箱则是较早的反应。根据推理,食物强化的是空等,而不是挖沙子到达目的箱。但事实上,白鼠习得的是挖沙子到达目的箱的反应,而不是空等。华生以此来证明效果律的不正确,并提出用频因律和近因律取而代之。

频因律(frequency)是指在其他条件相等的情况下,某种行为练习得越多,习惯形成得就越迅速。华生把反应出现的次数作为解释反应的保留或淘汰的原则,即联想重复次数越多,印象越深。近因律(recency)指当反应频繁发生时,最新近的反应比较早的反应更容易得到加强。因为在每一次练习中,有效的反应总是最后一个反应,所以这种反应在下一次练习中必定更容易出现。在华生看来,习惯反应必然是离成功时机最近出现的反应,即联想形成的时间离我们越近,印象越深。

四、早期行为主义学习理论在教学中的运用

早期行为主义学习理论家虽然少有直接论及理论在课堂中的运用,但我们可以运用这些理论于实际的教育活动中,例如:

第一,教师要仔细考虑哪些是学生需要掌握的基本知识点,提供经常复习的机会,反复练习巩固已建立的连接。如,小学教师每天早上可以花几分钟时间,以简单活泼的活动形式,复习较为复杂的和困难的知识;历史课教师如果希望学生记住一些重要的史实资料,那么教师可以将这些重要的史实材料整理成小册子,并告诉学生,这些是必须记住的、有用的史实材料,然后定时地、周期性地与学生一起复习这些史实材料。

第二,提供一个温暖的物质环境和心理环境,使教室和班级与积极的情感联系在一起。如,对一年级学生,教师应该每天早上面带微笑迎接和问候每一位学生,定期地关心和问候每一位学生的宠物情况、他们亲人的情况或者与学生生活相关的一些个人问题;对高年级学生,教师应该与学生一起建立一些规章制度,以防止学生以任何方式嘲弄和奚落其他同学,特别是在讨论问题和回答提问时,教师应该把尊重他人作为班级的首要制度。

第三,教师提问学生时,应使学生处于安全情景(主要是心理安全),确保提问带来的是积极的后果。如教师提问时应顾及每一位学生,而不是只提问一小部分学生,这样课堂就会与积极响应和努力思考建立联结;教师对那些低成就欲和不情愿回答问题的学生,开始时应该提一些简单的问题,如“你注意到这个问题了吗”、“请你对这两个问题进行比较”等,事实上,无论他怎样回答这些问题都是合适的,学生不情愿回答时,教师可以给一些提示,帮助学生回答问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈