1701490840
1701490841
我认为这一学说之所以不受大众青睐,部分原因在于对下述观点持有一种偏见,即任何事物的效果都能反作用于该事物以引起该事物的变化;部分原因在于不愿相信一种联结的效果对它产生了影响,只要这种影响的机制(mechanism)还是一个谜。这种偏见和不愿相信应当让位于事实。
1701490842
1701490843
我们了解了一种联结活动的哪些结果或后效确实强化或弱化着该联结,而且,如果我们能够的话,应该解释它们是如何强化或弱化联结的。但是,对于第二个问题,本次演讲将不予考虑。
1701490844
1701490845
由事实来证明的这一知识的首要要素是,增强联结的许多结果属于满意之物(satisfiers)。满意之物可以被界定为个体不想回避的一种状态,而且通常做些能够获得它和保持它的事情。例如,饥饿时的食物、压制后的自由、击中目标、听到人们说“对”而不是“错”,或者为他人或本人所赞许的其他一些东西——这些都是用来帮助动物或人类进行学习的满意之物的例子。那些减弱联结或增强某个不同联结的结果都属于讨厌之物(annoyer)。讨厌之物可以被界定为动物回避或加以改变的一种状态。电击、长期监禁、饥饿、听到说“错了”、未被准许或遭奚落、困惑、失败和羞耻都是一些常见的讨厌之物。
1701490846
1701490847
人们已经做过许多实验来比较某种满意之物的效果和讨厌之物的相反效果。
1701490848
1701490849
在这些实验中,最重要的实验是沃登(Warden)和爱尔斯沃思(Aylesworth)的实验。他们设计了一套装置,以便使一组年龄为3个月的白鼠进入通道之内。通道以一块明亮的地块[光源来自75瓦“马自达”(Mazda)灯泡]为标志,白鼠从地板格栅上接受电击。如果它们进入以黑暗地块为标志的通道,就不会受到电击,而且在“奖励”的实验情形里,“吃到浸过牛奶的面包”。
1701490850
1701490851
整个实验分为三级。在奖励组(R),对正确反应给予奖励,而当错误反应出现时,便将白鼠从目的箱中移出,转移到它们常住的笼子中或其他休息场所。在惩罚组(P),对待正确反应的措施与奖励组(R)中对待错误反应的措施一样,而伴随着错误反应而来的则是电击,然后将白鼠从栅栏中移去,并像上述那样转移。在奖励和惩罚组(RP),正确反应如上述一样得到奖励,而错误反应也像上述一样得到惩罚。
1701490852
1701490853
在奖励组中,10只白鼠学习十分缓慢,在平均293.5次尝试中,10次选择有9次正确。在惩罚组中,10只白鼠学习迅速,在平均56.2次尝试中,正确选择达到9/10的。在奖励和惩罚组中,10只白鼠学习速度更快,在平均32.8次尝试中,达到9/10的正确选择。惩罚组的白鼠在104.4次尝试中,20次选择有18次达到正确,而在奖励—惩罚组的白鼠中,只用59.7次尝试便达到了这一正确率。在惩罚组中,白鼠用145.9次尝试达到了30次选择中有27次为正确的选择率,可是在奖励和惩罚组中,白鼠只用67.3次尝试便达到了这一成绩。
1701490854
1701490855
受到电击惩罚的白鼠由此作出的反应往往是两种通道都不进去,而是待在反应室中。如果一只白鼠这样干了5分钟,那么它的尝试便被解释为失败,从而像上述一样被转移出去。如果学习任务是不进入错误的通道,那么受到过惩罚的老鼠会大大超越喂饱的老鼠。奖励—惩罚组的老鼠可以说通过惩罚学会了避开错误通道,通过奖励不再在反应室中待上5分钟,而是直奔正确通道去了。
1701490856
1701490857
在这类实验中,我们不仅应当考虑奖励本身和惩罚本身,而且还应当将正确反应的奖励和错误反应的后效相比较,并将错误反应的惩罚和正确反应的后效相比较。这种差别必须加以考虑。
1701490858
1701490859
在关于奖励效应的所有考虑中,我们也许不仅需要考虑奖励本身,还应当把奖励和“心向”(set)或“顺应”(adjustment)联系起来加以考虑。对一个动物来说,如果它的心向朝着获得自由,自由便可能具有更大的潜力,而食物或赞扬便具有较小的潜力;如果它的心向朝着获得食物或赞扬,情况便会相反。在老鼠走迷宫的实验中,毫无阻碍地奔跑而带来的满足可能在价值上超过从迷宫终端吃到食物所产生的满足。
1701490860
1701490861
把通过奖励来学习和通过惩罚来学习进行比较是一个具有巨大实践重要性的问题,因此我将简要报告一下最近一系列实验的结果。这些实验是我们在哥伦比亚大学师范学院的教育研究所(Institute of Educational Research of Teachers College,Columbia University)进行的。
1701490862
1701490863
我们提出这样的问题:“在其他条件均相等的情况下,对某一情境作出的正确反应,并得到宣布为‘正确’的奖励,从而增强了那个联结,是否超过了对某一情境作出错误反应,并受到宣布为‘错误’的惩罚,从而减弱了那个联结?”
1701490864
1701490865
在一个关于学习的实验中,通过反复选择,为一个单词挑选5种词义中的一种,每一次选择后都宣布“正确”或“错误”。我们记录了由9名被试来学习的200个单词的全部情况,也即印在每个单词后面的5种词义中的那个正确词义,是在第二次和第三次尝试中被选出的,而不是在此以前。我们把第一次选择中便选出正确词义的一切情况都略去了,因为在这样的情形中,正确的联结可能来自实验以前的经验所产生的起始力量(initial strength)。表7显示了20种情况,其中正确反应是在第二次和第三次尝试中作出的,而不是在第一次尝试中作出的。
1701490866
1701490867
表 7
1701490868
1701490869
对20个单词作出最初18个反应的学习过程,在第二次和第三次尝试中作出正确反应,而不是在此之前(c代表正确反应)。
1701490870
1701490871
1701490872
1701490873
1701490874
1701490875
1701490876
1701490877
我们还同样记录了所有这样的情况,即在第二次和第三次尝试而非在此之前,被试选择了同样的错误词义。其中有20个如表8所示。
1701490878
1701490879
表 8
1701490880
1701490881
对20个单词作出最初18次反应的学习过程,在第二次和第三次试中作出某种错误反应,而不是在此之前(o是指特定的错误反应以外的反应)。
1701490882
1701490883
1701490884
1701490885
1701490886
1701490887
1701490888
1701490889
现在,让我们来比较一下两组情况(其例子如表7和表8所示):我们所测量的是,在连续两次正确选择以后宣布为“正确”,它对以后正确反应的优势所具有的影响,以及在连续两次选择同样的错误词义并被宣布为“错误”以后,它对以后那个特殊错误反应的优势所具有的影响。
[
上一页 ]
[ :1.70149084e+09 ]
[
下一页 ]