首页 理论教育 斯金纳的操作条件作用理论

斯金纳的操作条件作用理论

时间:2022-03-05 理论教育 版权反馈
【摘要】:B.F.斯金纳是美国心理学家,操作条件作用理论的创始人,新行为主义的主要代表之一。从上述实验及分析中,可以看出桑代克的效果率为操作条件作用理论奠定了基础,斯金纳则系统的发展了这一理论。和早期行为主义者一样,斯金纳将他的理论建立在可观察的外显行为反应上。也就是说,学习是有机体通过操作性条件反射的建立,形成反应与情境刺激的联结。在操作条件作用中,消退是指消除强化从而导致行为发生的概率降低。

二、斯金纳的操作条件作用理论

B.F.斯金纳是美国心理学家,操作条件作用理论的创始人,新行为主义的主要代表之一。曾获美国心理学会授予的杰出科学奖、美国政府颁发的最高科学奖——国家科学奖,以及美国心理学会基金会颁发的金质奖章。

1938年斯金纳的《机体的行为》一书出版。本书概括了他的行为主义体系。斯金纳的工作并不关心有机体内部的变化、动机和情感状态,甚至连有机体的神经生理也不关心,所以人们说斯金纳的心理学是“空心有机体”心理学。在他看来,精神(甚至任何内在因素)都与理解人们的行为无关,他与早期联结理论家如桑代克、华生一样,都认为学习就是形成刺激-反应(S-R)联结,但他强调的是反应-刺激联结(R-S),他与其他早期行为主义理论家不同的是,他认为反应的后果影响进一步的行动,这些后果产生于外部环境,环境引起行为的变化,一个人将来做什么或不做什么,都是他自己与众不同的强化经历和惩罚经历直接导致的,即条件作用发生在一个反应之后紧接着给予的强化刺激。

(一)经典实验

20世纪30年代,斯金纳改进了桑代克的迷笼,设计了一种学习装置“斯金纳箱”,如图5-6所示,箱内设一杠杆,当动物压杠杆时,就会有一粒食物丸掉进箱子下方的盘中,动物就能吃到食物。实验时把饥饿的老鼠置于箱内,老鼠可以在箱内自由活动,他在活动的过程中,偶然踏上操纵杆,就会得到一粒食丸。老鼠经过几次尝试,就会不断按压杠杆以得到食丸,按压杠杆成为取得食丸的工具。由此斯金纳发现,反应之后出现的结果对有机体做出的反应起着控制作用,它能影响以后反应发生的概率。后来,斯金纳以类似的方法对其他动物和人也进行了研究,从中得出了操作性条件反射建立的规律:如果一个操作发生后,接着给予一个强化刺激,那么其强度就增加。只不过,强化增加的不是某一具体的反应,而是反应发生的概率。

img26

图5-6 斯金纳箱

在操作条件作用中,刺激情境S(杠杆)与按压杠杆的反应(R)形成了固定的联结。在斯金纳的实验中,S不是刺激,而是情境,在情境(杠杆S)中,有机体自发做出操作R,出现行为的结果S1,S1是增强情境S与反应R之间联结的强化物,提高有机体在S情境中做出R操作的效率,这就是操作条件作用的实质。

从上述实验及分析中,可以看出桑代克的效果率为操作条件作用理论奠定了基础,斯金纳则系统的发展了这一理论。从实质上看,桑代克的提出的动物为了达到某种目的而做出某种特定的行为,由此建立的条件作用(工具性条件作用)和斯金纳的操作性条件作用是一样的。

(二)操作性条件反射学习理论的基本观点

1.两种类型的反应行为

和早期行为主义者一样,斯金纳将他的理论建立在可观察的外显行为反应上。斯金纳认为,所有行为可以分为两类:应答性行为和操作性行为。应答性行为是由已知的刺激引发的,如在巴甫洛夫的经典条件作用实验中,狗被动地对食物及条件刺激铃声做出反应。”而操作性行为则不是由已知刺激引起的,而是有机体自身发出的。如将猫放入即使里面没有小鱼的笼子里,猫也会走动,这样的行为不是由外部的刺激引发的,而是有机体自动做出的。最初这些行为是自发的行为,由于它们受到强化而成为在特定情境中随意的或有目的的操作,如学生上课认真听讲,受到教师的表扬等,有机体通过主动操作这些行为以达到对环境的适应。相应的,他提出了两种条件作用:经典条件作用(条件反射)以及操作条件作用(条件反射)。斯金纳研究的是后者。所谓操作条件反射是指在某种情境中,由于个体的自发反应产生的结果而导致反应概率的提高,并最终与某一刺激情境建立起联系的过程。经典条件反射只能用来解释基于应答性行为的学习,斯金纳把这类学习称为S类条件作用,即S-R,另一种学习模式,即操作性条件作用的模式,则可以用来解释基于操作性行为的学习,他称为R类条件作用,即R-S。

经典条件作用与操作条件作用有着重要的区别。首先,行为产生的前提和过程不同。在经典条件作用中,行为最初是由UCS激发的,是UCS多次伴随CS同时或稍后出现,最后产生的刺激替代作用而形成的条件反射;而在操作性条件作用中,行为是由有机体自动发出的。有机体的行为由于得到强化,才学会了在某种情境中做出特定的反应。这是两者的根本区别。其次,学习的结果不同。在经典条件反射中,有机体学会的是刺激之间的关系,即中性刺激成为无条件刺激的信号;而在操作条件反射中,有机会学会了正确的反应,只有正确的行为才能得到强化。再次,强化及其作用不同。在经典条件作用中,新行为的习得依赖于UCS与CS的多次结合,这一过程即是强化,它没有奖赏作用,而在操作性条件作用中,行为发生率的提高依赖于行为之后是否出现的强化物,被强化的行为在以后更可能出现,因而强化具有奖赏作用。最后,行为的性质是不同的。经典条件反射中,有机体所要习得的行为(反应)是不随意的,通常是情绪的或生理的反应,而在操作条件反射中,有个体所要习得的行为是随意的。经典条件作用与操作条件作用的差异如表5-2所示。

表5-2 经典条件反射与操作条件反射的比较

img27

2.学习的实质

斯金纳认为,学习是指有机体在某种情境中自发做出的某种行为由于得到强化而提高了该行为在这种情境中发生的概率,即形成了反应与情境的联系,从而获得了用这种反应就会对该情境以强化的行为经验。也就是说,学习是有机体通过操作性条件反射的建立,形成反应与情境刺激的联结。

3.操作条件作用的基本过程

斯金纳通过实验认为,操作行为是有机体主动发出的,操作条件反应的过程如下:

(1)产生自由行为(关在箱子里的白鼠偶尔按压到杠杆,这是一种自由行为);

(2)某一行为之后,紧接着会有刺激刺激物呈现(如白鼠得到食物);

(3)得到强化后,反应行为再次发生的可能性增加。

这样,反应变得可控制和可预见了。值得一提的是,形成操作条件反应的事件发生序列必须与上面这一过程一样,食物必须在反应行为发生后出现。这是一条重要的原则。

通过操作条件作用习得的行为也面临着与经典条件作用习得的行为相同的命运,即得不到强化的行为会自然消退。在操作条件作用中,消退是指消除强化从而导致行为发生的概率降低。如在一些课堂上,老师发现有些过分焦急的学生不举手就回答老师的问题,如果老师要让他们形成举手回答问题的习惯,这时老师可以不理会他们,只让那些举手的学生起来回答问题,并且提醒全班学生“李明举了手在等待回答老师的问题”、“王华也举了手”等。老师很快就会发现,全班举手行为明显增加,并且那些并不参与讨论的学生也举起了手,参与讨论的机会增多了。

维持是指保持现有行为的发生概率。操作性条件反射形成后,为了永久保持所获得的行为,应该逐渐减少强化的频次。即维持一种行为的发生水平并不需要在每次行为发生之后都给予强化,间断强化可以实现维持的目的。不同的强化程序对行为维持的影响,见下面对强化的安排的介绍。

4.强化理论

在斯金纳的理论中,强化理论是最重要的部分和基础,是斯金纳理论的核心内容。他认为,行为的习得正是由于具有强化这个自变量才成为可能。

1)强化与强化物

斯金纳认为,行为之所以发生,就是因为强化的作用,形成操作性条件反应的关键就在于强化。强化决定了有机体行为方式的形成、转化的过程,也就是决定了学习的进行、学习的效果。合理地控制就能达到控制行为、塑造行为的目的。因此,了解强化及其原理是非常重要和有意义的。

斯金纳认为,强化物是指使反应发生的概率增加或维持某种反应水平的任何刺激,而利用强化物促使某一操作反应发生概率增加的过程就是强化。强化物每在相应的操作反应之后出现一次,我们就说这一操作反应得到了一次强化。可以看出,首先,强化是针对反应而言的,而不是针对有机体而言的,我们可以说食物丸强化了白鼠压杠杆的行为,而不能说食物丸对白鼠进行了强化。其次,强化物并不一定是令人愉快的刺激,强化物的作用只在于提高有机体某项行为出现的概率。

2)强化的类型

斯金纳强化的性质把强化区分为正强化和负强化。

所谓正强化是指在行为之后给予(呈现)某种积极的刺激以使行为发生的概率提高,比如儿童在做完作业之后父母通过给予表扬而增加儿童做作业的行为;而负强化则是指在行为之后通过撤销某种消极刺激以提高行为发生的概率,比如在闷热的教室里打开窗户可以使闷热的环境消失而提高开窗户这一行为的发生率。与惩罚不同,正强化与负强化都是为了增加反应发生的概率,而惩罚则是为了降低反应发生的概率,比如通过打骂而消除学生的不良行为。相应的惩罚也可以分为两种类型,正惩罚通过给予某种消极刺激来降低行为发生的概率,负惩罚则通过取消某种积极刺激来降低反应发生的概率。

专栏阅读

正强化与负强化的案例

一、正强化案例

(1)一个学生正在解题,当答不出某道题时,他就去问同学,同学就会告诉他答案。结果,他现在就更有可能一遇到问题就问同学。

(2)小宾在课堂上注意力集中时,老师就会微笑着表扬他。结果,小宾就更可能集中注意力。

二、负强化案例

(1)闹钟的作用。如果你早上醒来时发现比闹钟设定的时间早几秒钟,你往往会先去关闭闹钟,以防止它闹起来。在闹钟响起来之前就醒来实际上就是负强化作用的影响。

(2)买糖果与发脾气。食品店里的收银员经常会看到这样的情景:一个妈妈带着她的小宝贝在购物,小家伙一直都挺乖,可是当他看到一种糖果时,他要妈妈给他买,但妈妈没有答应。这时,小家伙开始哭闹,甚至是大发脾气。无奈之下,妈妈只好给他买了。在以后的几周里,你都会看到,这位妈妈只要一走进食品店,就先给孩子买糖果。

(3)打招呼。你是个教师,有一个孤独症的学生。他已经学会了每当走进教室就与你打招呼,说:“老师好。”但若是在一个大厅里,你的孤独症学生却不理会你招呼他。于是每当这时,你在招呼他时会走近他,并用手触摸他的身体帮助他与你目光接触,让他说:“老师好!”你的孤独症学生不喜欢你这种辅导方式,很快就找到了一种躲避的办法——在走进大厅后先说:“老师好!”

不同类型强化与惩罚的区别如表5-3所示。

表5-3 不同类型强化与惩罚的区别

img28

强化还可以根据强化物的性质分为两种类型:一级强化和二级强化。

一级强化物可以满足人和动物的基本生活需要,不需要学习,它包括所有在没有任何学习发生的情况下也起强化作用的刺激,如食物、水、安全、温暖和性等。二级强化物是指任何一个中性刺激如果与一级强化物反复联合,它就能获得强化的性质,是一种习得的强化,如表扬、金钱、奖品、小红旗等。二级强化物即那些在开始时不起强化作用,但后来作为与一级强化物配对的结果而起强化作用的刺激。斯金纳认为,对于人类来讲,二级强化物包括对大量行为起强化作用的许多社会性强化物(如社会接纳、微笑、名声、地位、特权等)、信物(如钱、奖品、级别等)和活动(如玩游戏、旅游等),这些大多是由社会文化所决定的,它们构成了决定人类行为的极有力的二级强化物。教师有时可以用一级强化物如糖果等强化学生的正确行为,但是教师用得更多地应该使用二级强化物强化学生的正确行为,如好的分数、赞赏、鼓励、表扬等。

强化原理中,有这样一个原则——普雷马克原理(祖母原则),即用高频的活动作为低频活动的强化物,或者说用那些学生更喜爱的活动奖励他们从事那些他们不太喜欢的活动,顺序不可颠倒。例如:学生必须先完成了数学作业,然后才可以看电视;在家里必须首先洗了碗,然后才可以出去玩球;或者必须整理了房间,才能玩游戏机;必须每天早睡早起,才可以在周末去游乐场。

3)强化的安排

强化的安排指强化出现的时机和频率。每一种不同的安排程式都产生相应的反应模式。斯金纳主要安排了五种强化程序。强化安排的分类情况如图5-7所示。

img29

图5-7 强化程序的分类情况

如果在每一个适当反应之后呈现一个强化,称连续强化,也称即时强化,连续强化在教新反应时最为有效;如果只在有些(而非所有)反应之后呈现强化,这称为断续强化,又称延缓强化。断续强化又可根据时间间隔和比率分为间隔程序和比率程序,间隔程序是根据历次强化之间的时间间隔而安排强化,比率程序是根据历次强化之间学习者做出适当反应的数量而安排强化,间隔程序和比率程序既可是固定的也可以是变化的。因此,断续强化程序比连续强化程序具有较高的反应率和较低的消退率。间隔程序强化由于有一个时间差,随之为较低的反应率,但在时间间隔的末尾反应率上升,出现一种扇贝效应,学生在期终考试前临时抱佛脚就证明了这一点。定比率式对稳定的反应率比较有益,而变比率式则对维持稳定和高反应率最为有效。不同强化程序对学习的影响效果是不同的,如表5-4所示。

表5-4 不同强化安排的不同学习效果

img30

在人们的日常生活中,操作行为的强化并不总是立刻发生,强化也不一定是有规则的和固定的,但是这种强化对人的行为仍然起很大的促进作用。生活中人们的许多行为受断续强化或延缓强化的维持和加强。

斯金纳对学习理论的研究作出了重大贡献。他通过严格的实验对操作条件作用进行了深入细致的研究,提出了操作性条件反射学说,并以此为基础建立了操作性条件的学习理论,在一定程度上克服了桑代克的试误说、巴甫洛夫和华生的经典条件反射说,用联结观解释学习现象的局限,将联结派学习理论推向了一个新的高度,他的理论在西方学习理论中占有极重要的地位。他对强化进行的研究既深入,又具体,系统性很强,揭示出的强化规律客观可靠。它是驯兽师的必修课,对人类的行为管理和学生学习过程的控制和激励有重要的参考价值。20世纪50年代兴起的“程序教学”运动显然应该归功于斯金纳的贡献。这项工作推动了个体化教学形式的深入研究。

斯金纳的操作性条件反射学习理论也受到了种种批评,最主要的批评是他试图以操作性条件作用原理解释人类的一切行为,忽略了人与动物学习的本质区别,这是错误的。同时,斯金纳对外部行为的过分强调,影响了他对人类心理的理解,他甚至认为环境决定人的全部行为,人的内部心理过程是环境产生行为时的副产品,不能用于解释行为。也正是由此,他被人们称为是“极端的行为主义者”。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈