1702302475
经验的疆界 复制成功的问题
1702302476
1702302477
作为适应机制,试误、模仿和天择有不同之处,但是在结构上有一些基本共同点。这些基本共同点及其引起的问题是本节讨论的主要焦点。此处讨论的现象,大都源自学习环境和适应机制的性质,而不是源自学习者的认知习惯,因此与那些著名的人类信息加工局限是不同的、基本上无关的。这些“结构性”问题是可以理解的,但是,理解了这些问题,并不代表就能解决这些问题。
1702302478
1702302479
第一,历史是复杂的。世界遵循一些永恒规律,从这个意义上说,世界也许是井然有序的,即使如此,世界还是充满复杂的因果关系。面对这样的复杂性,要从经验当中做出正确的推断,就要采用复杂的实验设计、使用多变量模型,还要使用大样本。不幸的是,在现实世界中复制成功,只能采用简单的内隐实验设计、简单的内隐相关模型和小样本。结果,通过复制成功而学习,特别容易犯下误设(misspecification)和迷信(superstition)的错误。
1702302480
1702302481
第二,历史充满随机不确定性。世界的井然有序掺杂着随机变异。根据经验找出最佳选项,就要解析信号、噪声和样本量的联合效应。
1702302482
1702302483
信号:选项之间的真实差异越大,通过观察一个样本找出真实最佳选项的机会越大。
1702302484
1702302485
噪声:观察结果的随机变异越小,通过观察一个样本找出真实最佳选项的机会越大。
1702302486
1702302487
样本量:样本越大,通过观察一个样本找出真实最佳选项的机会越大。
1702302488
1702302489
既然组织中的经验经常是信号弱、噪声大、样本小,那么变现历史就极有可能大大偏离深层现实。适应不是响应潜在历史分布,而是响应小样本实现的那个历史。这会导致过分偏爱一个其实并非很好的选项,进而导致错误地复制,或者导致过分轻视一个其实并非很差的选项,进而导致错误地回避。
1702302490
1702302491
研究随机过程的学者都知道,随机变异会造成一些十分惊人、违反直觉的意外(Feller 1968)。这些意外,很多是所谓的首次超越定理(first-passagetheorem),或者竞争上限定理(competitive maximum theorem)的变式。前者的一个例子是抛掷硬币:抛掷一枚硬币,大概抛掷多少次会半数以上是正面或者半数以上是反面?一般人的直觉是,次数较少。而实际情况是,平均而言,次数相当多。
1702302492
1702302493
竞争上限定理的一个例子是:比较两个相同的竞争者,每个竞争者每次实现的绩效,取自一个平均值为 0、标准差为 1 的正态分布。假设我们考虑两个竞争者历次变现绩效的平均值。随着经验的积累,第 t 次的历次变现绩效平均值较大的竞争者,第 t+1 次的历次变现绩效平均值也较大的可能性会增大。随着 t 的不断增加,这一可能性会变得非常大。根据历次变现绩效平均值对两个竞争者排名,这一排名会在很长一段时间内保持不变,即使两个竞争者在能力上是一样的,即使平均绩效之差会缩小。
1702302494
1702302495
第三,众选项的潜在结果分布受到历次所做选择以及历次变现结果的影响。复制成功自然会影响所选选项,进而影响所选选项的潜在结果分布。不那么显而易见的是,复制成功经常还会影响其他选项的潜在结果分布。用标准术语来说,每次的潜在结果分布内源于历次所做选择或历次变现结果。
1702302496
1702302497
这种内源性在有些案例中表现为消耗:也就是因为复制本身对后续结果有害,所以,平均而言,复制成功导致绩效降低。最显而易见的案例涉及,资源因使用或竞争而消耗。其他案例涉及,优势因开发而丧失(Barnett and Hansen 1996)。例如,假设一位网球选手采取的策略是把球打到对手较弱的那边(对手长于右手,就打到左边;对手长于左手,就打到右边)。这一策略会增加短期获胜的可能性,但是与此同时会为对手提供练习较弱那边的机会。随着时间的推移,练习效应会减小对手两手之间的能力差异,进而减弱“把球打到对手较弱那边”这个策略的竞争优势。其他例子包括,涉及厌倦或愤世嫉俗的案例。还有一些例子是涉及他人调整的案例,例如,喊“狼来了”的次数多了,别人就不把你的喊叫当回事了。
1702302498
1702302499
然而,也许更为重要的案例涉及的是结果分布因使用而改进——复制本身改进结果分布。一个重要的案例涉及,熟能生巧。每次选择一个选项,就会提高在这个选项上的能力。我们似乎有理由假定,一般而言,练习效应会增大所选选项结果分布的平均值、减小所选选项结果分布的标准差。
1702302500
1702302501
因为练习效应的存在,所以通过复制成功寻找最佳选项容易出现问题。这个问题一般称作“胜任力陷阱(competency traps)”(Levitt and March 1988;Arthur 1989)。假设某项活动的绩效是由这项活动的潜力和在这项活动上的胜任力共同决定的,潜力是固定的,胜任力是变化的。一般而言,胜任力起初较低,但随着练习而提高。既然绩效是由胜任力和潜力共同决定的,那么有了练习效应就更难找出最具潜力的选项。极有可能,一个潜力较低的选项会因为学习者比较擅长而胜过一个潜力较高的选项。组织经常会面临一种选择:一个是老做法(或流程、形式),缺点较多,但是用顺手了;另外一个是新做法(或流程、形式),优点较多,但是不大会用。在这两个选项面前,组织极有可能选择前者。复制成功更有可能加重而非缓解这一问题。
1702302502
1702302503
类似的,如果成功带来更多的成功,如马太效应(Merton 1968)那样,那么结果分布就内源于选择。例如,假设第 t 次的变现绩效 rt 取自平均值为 xt、标准差为 st 的正态分布,如果 xt 是 rt-1 的函数(例如,xt=rt-1),那么过程就会呈现弓形拉线特点,也就是选项结果间差异起初较小,后来越变越大。这种情况在组织中的一个显而易见的例子是早期绩效评价影响后续绩效评价,这样下去,起初很小的绩效评价个体差异会越拉越大。还有一个相关的例子,那就是模仿某项实务的可能性取决于这项实务的“合法性(legitimacy)”,而合法性又取决于已经有多少组织采用了这项实务(Carroll and Hannan 1989;Hannan 1998)。
1702302504
1702302505
复制成功还受成败评定(拿绩效与目标相比)以及目标调整(根据绩效调整目标)的影响(Payne,Laughhann,and Crum 1980,1981)。假设第 t 次的目标取决于第 t-1 次的目标和第 t-1 次的绩效。这样,目标就会向绩效靠拢(实际上,是以指数级速度趋近平均绩效),而且,过去绩效较低,目标就会调低,当前绩效必然也会降低。这让成败判定特别容易受到结果噪声的影响。通过让成功(进而复制成功)取决于绩效史,目标调整会放缓学习进程,尤其是当目标调整速度很快的时候(March and Shapira 1992)。另一方面,如果目标不随经验而调整,成败趋于稳定,那么学习就可能变成迷信活动(Lave and March 1975)。
1702302506
1702302507
学习在三个层面同时发生。第一个是学习做什么:寻找好的(或者最好的)技术、战略或合作伙伴,等等。第二个是学习如何做:精练并改进在某技术、战略或合作伙伴上的胜任力。第三个是学习期盼什么:调整绩效目标。因为学习在这三个层面同步进行,所以最佳选项更难找到了。在学习选择较好技术的同时,还要学习如何让这项技术发挥作用、如何调整对这项技术的期望值,三个层面的适应相互干扰。
1702302508
1702302509
第四,经验抽样率受样本结果的影响。选择一个选项付诸实施观察结果就获得一次经验,每次的经验都是深层现实的一个抽样值,与深层现实存在误差。样本越小,抽样误差越大,复制与成功相连的选项,回避与失败相连的选项,成功选项的经验样本量就会大于失败选项的经验样本量,进而,失败选项的经验抽样误差就会大于成功选项的经验抽样误差。
1702302510
1702302511
抽样误差导致体验式学习容易出现两类错误。第一类错误发生在抽样回报高于真实回报之时,第二类错误发生在抽样回报低于真实回报之时。既然成功选项的经验样本量因复制成功而增加,那么因高估选项价值而造成的误差就会自行矫正。复制会减小成功选项的经验抽样误差,进而暴露高估误差。另一方面,因低估选项价值而造成的误差不会自行矫正,初始结果较差的选项容易被低估、被轻视。
1702302512
1702302513
有些现象,只要被视作颇具典型性,就可以用一个简单的模型解释清楚。假设在一组 15 个选项中反复选择多次。每个选项 Ai 的结果是一个平均值为 xi、标准差为 s 的正态分布,xi′s 和 s 不随时间而变化,xi′s 本身来自一个平均值为 0、标准差为 S 的正态分布。每个选项有一个初始声誉 Ri,0=0,就是所有选项的平均期望。随后,每次所选选项的 Ri,t等于那个选项历次变现结果的平均值。这样,某个选项第 t 次的声誉所依据的观察次数,也许少到只有 0,也许多到有 t-1。每次选择声誉最高(max Ri,t)的那个选项,实现一个结果(取自那个选项的结果分布)。
1702302514
1702302515
这一简单模型可以解释内源抽样的后果。改进:当选项平均值之间存在差异(S>0),复制成功会让绩效随着时间而改进,还会找到并复制较好的选项。稳定:复制成功会让选择趋于稳定,而且这种趋势还十分强烈。即使选项平均值之间不存在差异(S=0),这一趋势还是存在,只是强度稍弱。声誉误差:所选选项声誉与那个选项结果分布真实平均值之间的差异(Ri,t-xi)是正的,也就是所选选项的声誉会高估能力。这一差异起初较大,后来会越变越小,最终(经过很多次选择)趋近于 0。最优性:当选项平均值之间存在差异(S>0),如果计算所选选项平均值与潜在最佳选项平均值之比,那么这一比值会随着时间而增加,但永远不会达到 1.0 复制成功很少会发现最佳选项。最终状态有好有坏。在因果结构并不复杂的简单情境中,如果选项之间存在差异、选项的结果相对稳定(低变异)、经验样本足够大,那么复制成功往往会让绩效随着时间而改进。复制成功往往会导致选择趋于稳定,也就是重复选择某个选项的可能性平稳地增大。复制成功往往会导致一段时间内所选选项的声誉(过去绩效)提高。声誉之所以提高,部分是因为越来越有可能选择较好选项,部分是因为选择了抽样误差为正的选项。
1702302516
1702302517
另一方面,通过复制成功而学习也有一些令人讨厌的特点。即使在简单情境下,通过复制成功而做出的选择也极有可能是次优的。某个学习水平的复制成功会与另外一个学习水平的复制成功相互混淆,例如造成胜任力陷阱。即使选项平均绩效与期望值之差最终会趋近于 0,在一段时间内所选选项的变现绩效也会大大低估那个选项的潜力。即使选项之间不存在差异(因此就寻找较好选项而言没有什么可学的),复制成功往往也会导致选择趋于稳定。即使没有什么可学,主观学习感也有可能十分深刻。
1702302518
1702302519
这些现象有一个惊人特征,那就是它们在很大程度上取决于经验的属性而非学习者的属性。当经验以让学习有效的方式展开,那么复制成功就会增长智慧。但是,当经验是复杂的、模糊的、充满随机变异的、样本量有限的(情况往往就是如此),那么复制成功——不管是通过试误,还是模仿,或者天择——就有可能导致次优状态。
1702302520
1702302521
1702302522
1702302523
[
上一页 ]
[ :1.702302474e+09 ]
[
下一页 ]