打字猴:1.702302498e+09
1702302498
1702302499 然而,也许更为重要的案例涉及的是结果分布因使用而改进——复制本身改进结果分布。一个重要的案例涉及,熟能生巧。每次选择一个选项,就会提高在这个选项上的能力。我们似乎有理由假定,一般而言,练习效应会增大所选选项结果分布的平均值、减小所选选项结果分布的标准差。
1702302500
1702302501 因为练习效应的存在,所以通过复制成功寻找最佳选项容易出现问题。这个问题一般称作“胜任力陷阱(competency traps)”(Levitt and March 1988;Arthur 1989)。假设某项活动的绩效是由这项活动的潜力和在这项活动上的胜任力共同决定的,潜力是固定的,胜任力是变化的。一般而言,胜任力起初较低,但随着练习而提高。既然绩效是由胜任力和潜力共同决定的,那么有了练习效应就更难找出最具潜力的选项。极有可能,一个潜力较低的选项会因为学习者比较擅长而胜过一个潜力较高的选项。组织经常会面临一种选择:一个是老做法(或流程、形式),缺点较多,但是用顺手了;另外一个是新做法(或流程、形式),优点较多,但是不大会用。在这两个选项面前,组织极有可能选择前者。复制成功更有可能加重而非缓解这一问题。
1702302502
1702302503 类似的,如果成功带来更多的成功,如马太效应(Merton 1968)那样,那么结果分布就内源于选择。例如,假设第 t 次的变现绩效 rt 取自平均值为 xt、标准差为 st 的正态分布,如果 xt 是 rt-1 的函数(例如,xt=rt-1),那么过程就会呈现弓形拉线特点,也就是选项结果间差异起初较小,后来越变越大。这种情况在组织中的一个显而易见的例子是早期绩效评价影响后续绩效评价,这样下去,起初很小的绩效评价个体差异会越拉越大。还有一个相关的例子,那就是模仿某项实务的可能性取决于这项实务的“合法性(legitimacy)”,而合法性又取决于已经有多少组织采用了这项实务(Carroll and Hannan 1989;Hannan 1998)。
1702302504
1702302505 复制成功还受成败评定(拿绩效与目标相比)以及目标调整(根据绩效调整目标)的影响(Payne,Laughhann,and Crum 1980,1981)。假设第 t 次的目标取决于第 t-1 次的目标和第 t-1 次的绩效。这样,目标就会向绩效靠拢(实际上,是以指数级速度趋近平均绩效),而且,过去绩效较低,目标就会调低,当前绩效必然也会降低。这让成败判定特别容易受到结果噪声的影响。通过让成功(进而复制成功)取决于绩效史,目标调整会放缓学习进程,尤其是当目标调整速度很快的时候(March and Shapira 1992)。另一方面,如果目标不随经验而调整,成败趋于稳定,那么学习就可能变成迷信活动(Lave and March 1975)。
1702302506
1702302507 学习在三个层面同时发生。第一个是学习做什么:寻找好的(或者最好的)技术、战略或合作伙伴,等等。第二个是学习如何做:精练并改进在某技术、战略或合作伙伴上的胜任力。第三个是学习期盼什么:调整绩效目标。因为学习在这三个层面同步进行,所以最佳选项更难找到了。在学习选择较好技术的同时,还要学习如何让这项技术发挥作用、如何调整对这项技术的期望值,三个层面的适应相互干扰。
1702302508
1702302509 第四,经验抽样率受样本结果的影响。选择一个选项付诸实施观察结果就获得一次经验,每次的经验都是深层现实的一个抽样值,与深层现实存在误差。样本越小,抽样误差越大,复制与成功相连的选项,回避与失败相连的选项,成功选项的经验样本量就会大于失败选项的经验样本量,进而,失败选项的经验抽样误差就会大于成功选项的经验抽样误差。
1702302510
1702302511 抽样误差导致体验式学习容易出现两类错误。第一类错误发生在抽样回报高于真实回报之时,第二类错误发生在抽样回报低于真实回报之时。既然成功选项的经验样本量因复制成功而增加,那么因高估选项价值而造成的误差就会自行矫正。复制会减小成功选项的经验抽样误差,进而暴露高估误差。另一方面,因低估选项价值而造成的误差不会自行矫正,初始结果较差的选项容易被低估、被轻视。
1702302512
1702302513 有些现象,只要被视作颇具典型性,就可以用一个简单的模型解释清楚。假设在一组 15 个选项中反复选择多次。每个选项 Ai 的结果是一个平均值为 xi、标准差为 s 的正态分布,xi′s 和 s 不随时间而变化,xi′s 本身来自一个平均值为 0、标准差为 S 的正态分布。每个选项有一个初始声誉 Ri,0=0,就是所有选项的平均期望。随后,每次所选选项的 Ri,t等于那个选项历次变现结果的平均值。这样,某个选项第 t 次的声誉所依据的观察次数,也许少到只有 0,也许多到有 t-1。每次选择声誉最高(max Ri,t)的那个选项,实现一个结果(取自那个选项的结果分布)。
1702302514
1702302515 这一简单模型可以解释内源抽样的后果。改进:当选项平均值之间存在差异(S>0),复制成功会让绩效随着时间而改进,还会找到并复制较好的选项。稳定:复制成功会让选择趋于稳定,而且这种趋势还十分强烈。即使选项平均值之间不存在差异(S=0),这一趋势还是存在,只是强度稍弱。声誉误差:所选选项声誉与那个选项结果分布真实平均值之间的差异(Ri,t-xi)是正的,也就是所选选项的声誉会高估能力。这一差异起初较大,后来会越变越小,最终(经过很多次选择)趋近于 0。最优性:当选项平均值之间存在差异(S>0),如果计算所选选项平均值与潜在最佳选项平均值之比,那么这一比值会随着时间而增加,但永远不会达到 1.0 复制成功很少会发现最佳选项。最终状态有好有坏。在因果结构并不复杂的简单情境中,如果选项之间存在差异、选项的结果相对稳定(低变异)、经验样本足够大,那么复制成功往往会让绩效随着时间而改进。复制成功往往会导致选择趋于稳定,也就是重复选择某个选项的可能性平稳地增大。复制成功往往会导致一段时间内所选选项的声誉(过去绩效)提高。声誉之所以提高,部分是因为越来越有可能选择较好选项,部分是因为选择了抽样误差为正的选项。
1702302516
1702302517 另一方面,通过复制成功而学习也有一些令人讨厌的特点。即使在简单情境下,通过复制成功而做出的选择也极有可能是次优的。某个学习水平的复制成功会与另外一个学习水平的复制成功相互混淆,例如造成胜任力陷阱。即使选项平均绩效与期望值之差最终会趋近于 0,在一段时间内所选选项的变现绩效也会大大低估那个选项的潜力。即使选项之间不存在差异(因此就寻找较好选项而言没有什么可学的),复制成功往往也会导致选择趋于稳定。即使没有什么可学,主观学习感也有可能十分深刻。
1702302518
1702302519 这些现象有一个惊人特征,那就是它们在很大程度上取决于经验的属性而非学习者的属性。当经验以让学习有效的方式展开,那么复制成功就会增长智慧。但是,当经验是复杂的、模糊的、充满随机变异的、样本量有限的(情况往往就是如此),那么复制成功——不管是通过试误,还是模仿,或者天择——就有可能导致次优状态。
1702302520
1702302521
1702302522
1702302523
1702302524 经验的疆界 [:1702302245]
1702302525 经验的疆界 低智学习与高智解释
1702302526
1702302527 尽管存在严重缺陷,但是复制成功是一个无所不在的学习工具。人类的适应,一般都是采用各种形式的复制成功。然而,与此同时,试误、模仿、天择的低智简单与人类对高智的希望是相互冲突的。因为自负(行动者和观察者都有),所以人类似乎不愿把自身行为归结为复制成功,而是偏爱比较复杂、比较认知的理解、解释和辩护。
1702302528
1702302529 一方面,复制成功无所不在;另一方面,人类偏爱高智历史解释和高智学习,这意味着通常用高智词汇描述的行为有可能实际上只是简单地复制与成功相连的行动,即低智学习。这是一个古老的观点,深受以巴甫洛夫为首的行为主义心理学家的喜爱;这一古老观点的另外一个形式,深受经济理论家的喜爱。
1702302530
1702302531 假设人类行为的机制实际上远远没有人类对人类行为的诠释复杂。特别是假设我们可以证明,某些行为“可以解释”为简单地复制成功而得到的产品。这样的证明,几乎证明不了复制成功是产生这些行为的主要机制,但是也许可以促使人们质疑那些比较复杂的解释。下面以人们非常感兴趣、学者经常研究的两种行为为例说明一下:风险承担和配偶选择。
1702302532
1702302533 风险承担
1702302534
1702302535 说到风险承担行为,最常见的观察(假定)是,不同的人有不同的风险特质,有的人是风险规避型,有的人是风险寻求型。一般而言,大多数人应该是风险规避型。例如,大多数人宁愿稳稳地获得 k 美元,而不愿有 p 的可能性获得 k/p 美元,或者(1-p)的可能性什么也得不到——尽管两个选项的期望值都是 k 美元。
1702302536
1702302537 在面对有关金钱的选择时,大多数人规避风险,对该现象的一个标准解释是,因为金钱的边际效用递减,所以确定选项的期望效用大于不确定选项的期望效用。更一般的是,经典理性选择理论把“风险偏好”简单地定义为“金钱效用曲线的任何非线性特征”。
1702302538
1702302539 有关风险承担行为的研究表明,风险承担受个体差异的影响并不如受情境的影响强烈。最常见的描述是:当期望值高于目标(收益),个体倾向于规避风险;当期望值低于目标(损失),个体倾向于寻求风险(Kahneman and Tversky 1979)。学者有时用“不求最好但求满意”解释这一现象(March and Shapira 1992)。
1702302540
1702302541 假设风险偏好既不是个体特质又不直接取决于情境,而是学习的产品。已经有人证明,通过简单地复制成功而学习就会导致在收益面前规避风险、在损失面前寻求风险(March 1999c,第 15 章;Denrell 2007)。收益分布变异大的选项,其潜力可能因为样本小而被低估,进而被放弃。另一方面,损失分布变异小的选项,可能因为初步尝试几次总是得到负面结果而失去抽样机会,也就是被放弃。
1702302542
1702302543 这种现象的一个特例涉及小概率极端事件。小概率事件的出现次数分布是严重倾斜的。例如,重大科学突破。这样的事件,结果极其正面,但是发生机会非常之小。大多数研究者一辈子都不会经历这样的事件。实际上(或者,可能实际上),大多数学习者会低估极其稀有、极其正面事件的发生可能性,进而无意识地规避风险,不能像本来可能的那样复制与重大科学发现相连的行动(例如,高度敬业、积极投入)。
1702302544
1702302545 还有一些案例,涉及的是极少发生但后果十分严重的事件,比如核电厂的核事故。核事故的发生可能性极低,核电厂的大多数操作员不会经历。实际上(或者,可能实际上),大多数学习者会低估极其稀有、极其负面事件发生的可能性,进而无意识地寻求风险,复制增加核事故发生可能性的行为(例如,粗心大意)。在诸如此类的案例中,收益面前规避风险、损失面前寻求风险,不过是学习的产品。
1702302546
1702302547 看看这两类案例的不同之处,在涉及稀有正面事件的案例中,因为没有经历过事件,所以个体会放松复制加大事件发生可能性之行动(例如,勤奋努力)的力度,进而不仅减少矫正对事件发生可能性无意识低估的机会,而且真正让事件变得不大可能。学习会降低做出重大科学突破的机会。在涉及稀有负面事件的案例中,因为没有经历过事件,所以个体会放松回避加大事件发生可能性之行动(例如,马虎大意)的力度,进而不仅增加矫正对事件发生可能性无意识低估的机会,而且真正让事件变得更加可能。学习会增加酿成重大核事故的可能性,还会既通过更多地经历核事故又通过让核事故变得更加可能来“矫正”对风险的低估。
[ 上一页 ]  [ :1.702302498e+09 ]  [ 下一页 ]