打字猴:1.701777996e+09
1701777996
1701777997 如果你认为简是明智的,而乔不是,那么只能说你比较了解体育竞赛的情况,却对戏剧演出知之甚少。如果你的结论正相反,则说明你熟悉戏剧演出而对体育竞赛不太了解。
1701777998
1701777999 我发现,那些不太了解体育的人往往认为乔可能是对的,即那个四分卫或许并没有那么有天赋;而了解体育竞赛的人更倾向于认为乔下的结论可能太过草率。他们认为,乔用于判断那个四分卫的表现的(极其小的)样本更可能是一种极端的情况,而给乔推荐那个孩子的教练的评价可能更接近实际情况。
1701778000
1701778001 那些不太了解戏剧表演的人可能会说那个女孩或许没有那么出色,然而了解戏剧的人会认为简对女孩的判断有些轻率。在其他条件都一样的情况下,你对某个特定领域了解得越多,你就更可能成功运用统计学概念来考虑相关问题。在这个例子中,重要的概念便是大数定律。
1701778002
1701778003 为什么这与大数定律有关呢?一个四分卫在一个或更多赛季的表现可以被看作评判其技术的可信依据。如果他的教练坚持认为他的确出色,那么我们有大量证据——众多技术统计数据——推断乔考察的这位球员真的特别优秀,乔自己的证据——一天中的一场比赛的表现与之相比就显得太不可信了。
1701778004
1701778005 一个球员自身表现的可变性,甚至是一支球队表现的可变性,就像一句老话形容的那样,在某一个星期日,美国全国橄榄球联盟中的任何一支球队都可以击败其他任何一支球队。这当然不是说所有球队的水平完全一样,这只是表明你需要一个相当大的样本量来准确评断不同球队的水平。
1701778006
1701778007 同样的推断逻辑也可以应用于那位戏剧项目负责人的判断。如果有好几位了解那位女演员的人都表示她有很高的才华,那么这位负责人就要对自己的判断三思。我发现很少有人意识到这一点,除了那些有一些戏剧表演经验或对表演领域十分熟悉的人。喜剧演员史蒂夫·马丁在自传中曾提到,几乎所有喜剧演员都有奉献出伟大演出的时刻。那些成功者不过是能时时保持良好水平以上的人。
1701778008
1701778009 用统计学术语来讲,球探和音乐剧项目负责人试图寻找的是他们考察的候选人的“真分数”。考察结果包括真分数和偏误。这个公式适用于几乎所有类型的测量项目,无论是人的身高,还是某一地的气温,都是如此。有两种途径可以提高分数的准确性。一种是应用更好的观测法——更好的码尺或是温度计。另一种是“消除”你在测量过程中可能出现的各种偏误,这可以用大数定律或是求取平均值来解决。大数定律这样发挥作用:你进行的测量越多,便会越接近于真分数。
1701778010
1701778011 访谈错觉
1701778012
1701778013 即使我们对一些领域有丰富的知识,也掌握了大量统计学原理,但仍有可能忘记大数定律的变化性和相关性。密歇根大学心理系对其顶尖的申请人进行面试,以做出最终的录取决定。我的同事对于和每个候选人进行20~30分钟的面试十分看重。“我认为她不合适。她似乎对我们讨论的课题没有太深的见地。”“他看上去十分合适。他谈到了他出色的荣誉论文,而且清晰地表达了他对如何做学术研究的理解。”
1701778014
1701778015 这里的问题是,我们究竟该依据什么来评判一个人,应该让他在一段很短时间内的表现成为主要依据吗?还是应该综合评估其各项条件:大学里的平均绩点,它总结了一个学生4年中在30门或更多课程中的表现;研究生入学考试(GRE)成绩,它从一个侧面反映了一个学生12年的学习成果和综合知识能力;推荐信,这通常会基于这个学生与推荐人长期的接触和交流。实际上,大学平均绩点在很大程度上能预测出一个学生在研究生院的表现(就像你在下一章节中会看到的,两者的相关性至少能达到0.3),研究生入学考试分数同样重要。这两项标准是相互独立的,因此同时使用这两个标准进行评估比单独使用其中一项要更有效。而加上推荐信之后,对学生评估的准确率就更高了。
1701778016
1701778017 然而,半小时的面试结果与一个学生在本科或研究生阶段的表现仅仅存在不到0.1的相关关系,同样的情况也可见于陆军军官、商务人士、医学院学生、和平队志愿者和其他各类面试中。那是一种相当不准确的预测,不会比投硬币预测好太多。其实人们如果只是以面试该有的价值来看待它,那么结果并不会太糟,只要不将它当作决定性因素就好。然而人们总是在过于看重面试的误区中让自己逐渐偏离准确结果。
1701778018
1701778019 实际上,人们过度看重面试的价值,以至很容易最终事与愿违。他们认为,面试表现比平均绩点高更有说服力,面试会比基于和候选人长期接触而产生的推荐信更能预测候选人在美国和平队的表现。
1701778020
1701778021 对于“面试”,我们应当明白:如果对于一个学校或一份工作的候选人来说,可以在他的申请材料中获取重要的、有价值的信息,那么最好不要再面试他了。如果你能够以面试真正具有的并不那么重要的价值来衡量它,那么它就不可能真的影响你的判断。然而,我们几乎无法抑制自己要过度看重面试的倾向,因为我们对于通过直接观察一个人而了解其能力和品性有着不切实际的自信。
1701778022
1701778023 这就像是我们将面试中对某个人的印象看作对他进行了全息摄影的结果——只有一些微小的、模糊的结果是可以确定的,但是那并不是一个人完整的样子。我们应当把面试看作对一个人进行了解的微小的、碎片化的,甚至可能是有所偏差的侧面。想想盲人摸象的故事,你应该不想成为其中的一个盲人吧。
1701778024
1701778025 面试错觉和基本归因谬误同出一源,它们都是我们将所获取的不完整的信息夸大的结果。进一步来说,基本归因谬误就是我们高估了一些确定性的性格因素而忽视了环境因素,这会让我们对于面试中获得的信息产生怀疑。更好地理解大数定律有助于我们避免更多的基本归因谬误,并减少面试错觉。
1701778026
1701778027 我希望我能说自己对于面试有效性的知识会常常让我质疑自己基于面试而得出的结论。然而,效果真的有限。那种我自以为有价值的知识导致错觉的力量十分强大。我不得不严肃提醒自己不要太看重面试——或者其他通过短时间接触就下结论的情形。这一点在我能从其他途径(他人在长期接触中对某人形成的印象、学术记录或者工作成就)获得更充分信息时尤其重要。
1701778028
1701778029 当然,我会很容易就记住你在面试中表现出的非常有限的判断力!
1701778030
1701778031 离散与回归
1701778032
1701778033 我有一个朋友凯瑟琳,她的工作是为医院进行管理实务的咨询。她十分热爱自己的工作,一部分原因是她可以借工作之便去各地旅行,结识新的朋友。她对美食情有独钟,总会去那些受到高度认可的餐厅体验。然而,她常常抱怨,当她第二次再去那些起初觉得好的餐厅时,却再也品尝不到当日的美味了。你觉得原因是什么呢?
1701778034
1701778035 如果你说“可能是厨师极大地改变了烹饪方法”,或者猜测“可能是她的期待太高了,以至实际情况会让她失望”,那么,你就忽略了一些重要的统计学的因素。
1701778036
1701778037 以一种统计学的视角来看待这个问题,那么你首先应当想,凯瑟琳在任何一个场合、任何一家餐厅吃到特别美味的食物总存在一种偶然因素。当一个人在不同情形下在同一家餐厅吃饭,或是一群食客于某一个时间在某家特定的餐厅吃饭,人们对于好吃与否的评断标准都会存在差异。凯瑟琳在某家餐厅吃到的第一顿饭可能只是马马虎虎(甚至更糟糕),也可能极其美味。这种变化便是我们评断食物质量的变量。
1701778038
1701778039 任何连续的变量(会存在从一个极端到另一个极端的连续完整值域,比如身高),和与它相反的非连续变量(比如性别或是政治倾向)相比,都会有一个均值和一个围绕均值分布的值域。基于这一点,我们就不难理解凯瑟琳总会感到失望:有时她第二次去同一家餐厅的体验会比第一次差,这几乎是必然的(当然有时候第二次的体验会好于第一次)。
1701778040
1701778041 但是我们还要进一步分析。我们可以预期,凯瑟琳对一家之前有着不错印象的餐厅的看法会改变,认为它不如从前了。这是因为,越是接近一个给定值的平均值,那么它就越会显得不出众。一个值距离均值越远,则那个值越珍贵。因此,如果她在场合1中吃到了美味的一餐,那下一餐就可能就没有那么美味(在值域上处于极端位置)了。这对于所有符合正态分布定义的变量都是成立的,该曲线被称作“钟形曲线”,如下图所示。
1701778042
1701778043 正态分布是一种数学上的抽象表示,但是其形态时常惊人地近似于连续变量的分布——每周由不同母鸡下的鸡蛋数量,每周制造的汽车变速器中出现的差错数量,人们的智商分数分布几乎都近似于正态分布。没有人知道这究竟是为什么,但这的确是事实。
1701778044
1701778045 有许多种方式可用于描述在均值周围分布的样本的离散情况。其中一种是值域,即在可见样本范围内用最高值减去最低值。一种更有用的描述离散情况的工具是以均值为基准而产生的平均离差。如果凯瑟琳在不同城市的餐厅品尝的第一顿美餐的平均质量是“非常好”,而均值的平均离差分别为“很高”(高的一边)和“一般好”(低的一边),那么我们会说针对凯瑟琳第一顿美餐的质量均值而产生的平均离差(离散程度)不算非常大。如果平均离差的范围是从“极好”到“极普通”,那么我们认为离散程度很大。
[ 上一页 ]  [ :1.701777996e+09 ]  [ 下一页 ]