打字猴:1.70149082e+09
1701490820 图形3在0出现之前有9个-4,但0仍占优势。
1701490821
1701490822 图形4在0出现之前有4个-4,但0仍占优势。
1701490823
1701490824 图形9在0出现之前有5个-5,但0仍占优势。
1701490825
1701490826 图形10在0出现之前有3个-6,但0仍占优势。
1701490827
1701490828 在汉密尔顿(G.V.Hamilton)的实验中,让6只老鼠学习从4条胡同中的一条胡同里面逃出来。结果,在最初的2次尝试中,3只老鼠选择错误的胡同和选择正确的胡同的比例为2∶1。有2只老鼠每次在选择了2条或2条以上的错误胡同后才能发现并选择正确的胡同。只有1只老鼠选择正确胡同的反应多于选择错误的胡同。但是,所有老鼠很快便不约而同地开始选择正确的胡同了(如果我们单单根据第一次尝试,那么3只老鼠选择胡同的错误与正确之比为2∶1或4∶1,1只老鼠为1∶1,另外2只老鼠全部选择正确)。
1701490829
1701490830 耶基斯(R.Yerkes)的2只猴子斯克尔(Skirrl)和索尔克(Solke)在多项选择实验的所有困难问题中(第2、3、4题),最初10次尝试时的错误反应比正确反应的次数要多,然而,它们最终还是把错误反应完全抛弃了。实验情况如表6所示。
1701490831
1701490832 表 6
1701490833
1701490834 斯克尔和索尔克两只猴子在耶基斯的多项选择装置的最初系列中,作出正确反应的频率和最为常见的错误反应。
1701490835
1701490836
1701490837
1701490838
1701490839 * 未能达到上述这些场景的掌握
1701490840
1701490841 我认为这一学说之所以不受大众青睐,部分原因在于对下述观点持有一种偏见,即任何事物的效果都能反作用于该事物以引起该事物的变化;部分原因在于不愿相信一种联结的效果对它产生了影响,只要这种影响的机制(mechanism)还是一个谜。这种偏见和不愿相信应当让位于事实。
1701490842
1701490843 我们了解了一种联结活动的哪些结果或后效确实强化或弱化着该联结,而且,如果我们能够的话,应该解释它们是如何强化或弱化联结的。但是,对于第二个问题,本次演讲将不予考虑。
1701490844
1701490845 由事实来证明的这一知识的首要要素是,增强联结的许多结果属于满意之物(satisfiers)。满意之物可以被界定为个体不想回避的一种状态,而且通常做些能够获得它和保持它的事情。例如,饥饿时的食物、压制后的自由、击中目标、听到人们说“对”而不是“错”,或者为他人或本人所赞许的其他一些东西——这些都是用来帮助动物或人类进行学习的满意之物的例子。那些减弱联结或增强某个不同联结的结果都属于讨厌之物(annoyer)。讨厌之物可以被界定为动物回避或加以改变的一种状态。电击、长期监禁、饥饿、听到说“错了”、未被准许或遭奚落、困惑、失败和羞耻都是一些常见的讨厌之物。
1701490846
1701490847 人们已经做过许多实验来比较某种满意之物的效果和讨厌之物的相反效果。
1701490848
1701490849 在这些实验中,最重要的实验是沃登(Warden)和爱尔斯沃思(Aylesworth)的实验。他们设计了一套装置,以便使一组年龄为3个月的白鼠进入通道之内。通道以一块明亮的地块[光源来自75瓦“马自达”(Mazda)灯泡]为标志,白鼠从地板格栅上接受电击。如果它们进入以黑暗地块为标志的通道,就不会受到电击,而且在“奖励”的实验情形里,“吃到浸过牛奶的面包”。
1701490850
1701490851 整个实验分为三级。在奖励组(R),对正确反应给予奖励,而当错误反应出现时,便将白鼠从目的箱中移出,转移到它们常住的笼子中或其他休息场所。在惩罚组(P),对待正确反应的措施与奖励组(R)中对待错误反应的措施一样,而伴随着错误反应而来的则是电击,然后将白鼠从栅栏中移去,并像上述那样转移。在奖励和惩罚组(RP),正确反应如上述一样得到奖励,而错误反应也像上述一样得到惩罚。
1701490852
1701490853 在奖励组中,10只白鼠学习十分缓慢,在平均293.5次尝试中,10次选择有9次正确。在惩罚组中,10只白鼠学习迅速,在平均56.2次尝试中,正确选择达到9/10的。在奖励和惩罚组中,10只白鼠学习速度更快,在平均32.8次尝试中,达到9/10的正确选择。惩罚组的白鼠在104.4次尝试中,20次选择有18次达到正确,而在奖励—惩罚组的白鼠中,只用59.7次尝试便达到了这一正确率。在惩罚组中,白鼠用145.9次尝试达到了30次选择中有27次为正确的选择率,可是在奖励和惩罚组中,白鼠只用67.3次尝试便达到了这一成绩。
1701490854
1701490855 受到电击惩罚的白鼠由此作出的反应往往是两种通道都不进去,而是待在反应室中。如果一只白鼠这样干了5分钟,那么它的尝试便被解释为失败,从而像上述一样被转移出去。如果学习任务是不进入错误的通道,那么受到过惩罚的老鼠会大大超越喂饱的老鼠。奖励—惩罚组的老鼠可以说通过惩罚学会了避开错误通道,通过奖励不再在反应室中待上5分钟,而是直奔正确通道去了。
1701490856
1701490857 在这类实验中,我们不仅应当考虑奖励本身和惩罚本身,而且还应当将正确反应的奖励和错误反应的后效相比较,并将错误反应的惩罚和正确反应的后效相比较。这种差别必须加以考虑。
1701490858
1701490859 在关于奖励效应的所有考虑中,我们也许不仅需要考虑奖励本身,还应当把奖励和“心向”(set)或“顺应”(adjustment)联系起来加以考虑。对一个动物来说,如果它的心向朝着获得自由,自由便可能具有更大的潜力,而食物或赞扬便具有较小的潜力;如果它的心向朝着获得食物或赞扬,情况便会相反。在老鼠走迷宫的实验中,毫无阻碍地奔跑而带来的满足可能在价值上超过从迷宫终端吃到食物所产生的满足。
1701490860
1701490861 把通过奖励来学习和通过惩罚来学习进行比较是一个具有巨大实践重要性的问题,因此我将简要报告一下最近一系列实验的结果。这些实验是我们在哥伦比亚大学师范学院的教育研究所(Institute of Educational Research of Teachers College,Columbia University)进行的。
1701490862
1701490863 我们提出这样的问题:“在其他条件均相等的情况下,对某一情境作出的正确反应,并得到宣布为‘正确’的奖励,从而增强了那个联结,是否超过了对某一情境作出错误反应,并受到宣布为‘错误’的惩罚,从而减弱了那个联结?”
1701490864
1701490865 在一个关于学习的实验中,通过反复选择,为一个单词挑选5种词义中的一种,每一次选择后都宣布“正确”或“错误”。我们记录了由9名被试来学习的200个单词的全部情况,也即印在每个单词后面的5种词义中的那个正确词义,是在第二次和第三次尝试中被选出的,而不是在此以前。我们把第一次选择中便选出正确词义的一切情况都略去了,因为在这样的情形中,正确的联结可能来自实验以前的经验所产生的起始力量(initial strength)。表7显示了20种情况,其中正确反应是在第二次和第三次尝试中作出的,而不是在第一次尝试中作出的。
1701490866
1701490867 表 7
1701490868
1701490869 对20个单词作出最初18个反应的学习过程,在第二次和第三次尝试中作出正确反应,而不是在此之前(c代表正确反应)。
[ 上一页 ]  [ :1.70149082e+09 ]  [ 下一页 ]