奖励与惩罚的心理学原理

时间：2022-03-11 理论教育版权反馈

【摘要】：正强化也称阳性强化,是指个体做出某种行为或反应,随后同时得到某种奖励,从而使行为或反应强度、概率或速度增加的过程。当老师对其进行正强化时,她与伙伴玩耍的频率显著增加了。当正强化停止后,小女孩与同伴玩耍的频率降低,而在第四阶段,随着正强化重新开始,她与同伴玩耍的频率又增加了。正惩罚是指某一行为产生后伴随着讨厌刺激物的出现,从而减少这一行为再次出现的可能性。

(一)强化与惩罚

斯金纳认为,强化是指在一种刺激情境中,有机体的某种反应后果有使该反应出现的概率提高的作用。能起到强化作用的反应后果,如得到食物或奖励等,叫作强化物。惩罚是指一个反应之后的一个刺激或事件减少了这个反应再次发生的可能性。所谓惩罚物,就是指其呈现可以降低反应发生概率的事件。厌恶刺激和厌恶活动,都是惩罚物。研究表明,厌恶刺激和厌恶活动的承受、积极刺激和积极活动的撤离,都可降低行为发生的概率。

斯金纳还进一步将强化和惩罚划分为四种类型(见表1)。

表1 强化和惩罚的四种类型

pagenumber_ebook=79,pagenumber_book=79

1.正强化

正强化也称阳性强化,是指个体做出某种行为或反应,随后同时得到某种奖励,从而使行为或反应强度、概率或速度增加的过程。正强化的方法包括表扬、鼓励、对成绩的认可、奖金、改善条件、给予学习和成长的机会等。当个体反应后出现的刺激物强化了该反应时,这种刺激物叫作正强化物。例如,如果家长的一次鼓励增加了孩子完成学习任务的可能性,那么,鼓励就是正强化物,孩子完成任务就受到了鼓励的正强化。

典型案例

早在20世纪60年代,一群学前教育的老师进行了一项经典的研究,他们利用正强化帮助一位小女孩克服羞涩心理,这项研究成为最被广泛引用的关于正强化的例证(Allenetal.,1964)。这群老师非常担心这个小女孩,因为她几乎不和其他小朋友玩耍,而花太多时间和成年老师待在一起,于是老师们决定通过正强化鼓励她与小朋友玩耍。他们知道,这个小女孩喜欢得到来自老师的表扬,所以他们决定只有当她和另一个小朋友一起玩耍时才表扬她。

他们首先统计了在对小女孩采取措施之前,她同其他孩子及老师交往的频率。第二阶段,老师在小女孩和其他孩子玩耍时给予正强化(表扬),但几乎不对她赋予其他关注,这样,她仅在和其他孩子玩耍时才能得到来自老师的正强化。当老师对其进行正强化时,她与伙伴玩耍的频率显著增加了。为了确定是正强化而不是其他因素导致了这种改变,教师在第三阶段(撤销阶段)停止了对小女孩进行强化,在第四阶段重新对其进行强化。当正强化停止后,小女孩与同伴玩耍的频率降低,而在第四阶段,随着正强化重新开始,她与同伴玩耍的频率又增加了。这样,老师们通过使用正强化手段,能够有意地教给这个小女孩一种更具适应性的玩耍模式。

2.负强化

负强化也称阴性强化,是通过厌恶刺激的排除来增加反应在将来发生的概率,即减少或取消厌恶刺激来增加某行为在以后发生的概率。负强化的方法包括撤销批评、处分等。当个体反应后使厌恶性刺激减少或消失从而强化了该反应时,这样的刺激物就叫作负强化物。例如,当孩子认真完成家庭作业就不再受到父母的责骂,那么,父母的责骂就是一个负强化物,孩子完成家庭作业的行为受到父母责骂的消失的强化。在小轿车上的乘客系上安全带后,一个厌恶的提示音即刻消除,从而强化了乘客系安全带的行为,这也是负强化的典型例子。

3.正惩罚

正惩罚是指某一行为产生后伴随着讨厌刺激物的出现,从而减少这一行为再次出现的可能性。当儿童出现不适宜的行为时,如作业没有完成,家长可以施加一个坏的刺激,如严厉的批评,给予儿童相应的处罚,就属于正惩罚。当个体在一定刺激情境中做出某一行为后,若及时使之承受厌恶刺激或厌恶活动,那么个体在今后类似刺激情境中,该行为的发生概率将会下降。通常正惩罚采用的刺激都是儿童极力避免的刺激,如斥责、批评、体力劳动、体罚等,这些刺激一般会令儿童感到不快,从而使得儿童改变自己的不适宜行为。正惩罚必须注意,惩罚的是什么,意义要明确,时间要适当。

典型案例

小林一家人正在吃晚饭,小林不好好吃饭,妈妈命令他站在一边,不准吃饭。全家人继续吃饭,没有过多地注意小林。一会儿,小林表示:“妈妈,我不闹了,以后好好吃饭还不行吗?”于是妈妈答应他,让小林坐下来继续吃饭。

在这个案例中,小林妈妈其实先采用了惩罚,再用负强化,接着让小林继续吃饭则采用了正强化的行为矫正方法。小林出现不适宜行为(不好好吃饭),妈妈给予正惩罚(站着),来减少小林不好好吃饭的不适宜行为。同时进行了负强化(不准吃饭),希望增加小林好好吃饭的适宜行为。在小林意识到自己的错误,希望表现出适宜性行为时,妈妈对其进行了正强化,表示一旦小林好好地吃饭就可以坐下来继续吃饭了。这样小林就会意识到好好吃饭是适宜行为,这就可能增加其后好好吃饭这一适宜行为的出现概率。

4.负惩罚

负惩罚是指某一行为产生后伴随着喜爱刺激物的消失,从而减少这一行为再次出现的可能性。即当不适当的行为出现时,不再给予原有的奖励。当个体在一定刺激情境中做出某一行为后,若及时撤除正在享用的积极刺激或积极活动,那么个体在今后类似刺激情境中,该行为的发生概率将会下降。如两个孩子在看一部非常好的动画片时突然打起架来,家长去掉一个好的刺激,如关掉电视,以减少儿童不适宜行为(打架)的出现概率。儿童不愿意吃药,本来家长要带儿童出去玩耍,这样就可以取消玩耍的计划,直到儿童吃药为止。负惩罚比正惩罚更为常用。

典型案例

有一个学生,做作业速度非常慢,常常拖拖拉拉,做做停停,爸爸妈妈对于孩子这个缺点无可奈何。但是孩子又非常喜欢看电视,常常又因为看电视而影响做作业的质量和速度。结合这两点,我告诉家长,以看电视作为惩罚的刺激物,只有当孩子在规定时间内完成作业,或者只有孩子完成作业后才可以看电视,否则无论如何都不会给他看电视。坚持一段时间后,发现孩子完成作业的速度有一定程度的提高。恢复看电视的过程就是正强化。

在家庭教育中,如果小孩的行为不符合要求,可以取消他的某些权利,如不准他玩、不准他参与某项活动等——这是实施负惩罚;当他的行为符合要求时恢复他之前丧失的权利——这是实施正强化。

(二)强化的程序

斯金纳及其同事把强化程序分为连续强化程序和部分强化程序。连续强化程序是指每一次理想行为出现时,都给予强化。部分强化程序并不是对每一次理想行为都给予强化,但是为了保证行为能够重复,强化的次数也应是充分的。部分强化可以分为四种类型,即固定频率、固定间隔、变化频率、变化间隔四种策略。

1.固定频率强化

是指强化物在有机体做出一定数目的反应后才出现,例如,学生交五次作业受到一次强化、计件工资等属于固定频率强化。

2.固定间隔强化

是指强化物在经过一个确定的时间间隔后加入,如家长可以每十分钟观察孩子一次,如果孩子这时表现良好,就给予强化。

3.变化频率强化

是指强化由反应次数所决定,但每次强化所要求反应的次数不一样,机体做出的反应越多,得到的强化也越多,但机体不知强化的标准,不能完全控制强化。如买彩票不知道哪一次会中奖,日常生活中家长对儿童的表扬、批评等,多属于此类。

4.变化间隔强化

是指强化出现的时间无规律可循,机体不知何时出现强化,但总有一种就要出现的预想,所以反应速度比较稳定、不出现停顿。如不定期的作业检查等。

前两种属于定期策略,其好处是儿童每一次正确反应都得到强化,因此能产生快速学习。它的缺点是动物和人都可能对这种定期的固定奖励形成预期和依赖,一旦奖励完全取消,就比较难保持曾被奖励过的行为。后两种属于不定期策略,其好处是能引发非常高的反应频率和非常强的抵御消退的能力。因为奖励的实施无规律,儿童从来就不能准确知道何时将得到奖励,他们对奖励的依赖较弱,并且偶尔获奖还使他们体验到一种出乎意料的惊喜。所以在奖励完全停止后,他们仍能保持相当长时间的正确反应。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈