1701778018
1701778019
实际上,人们过度看重面试的价值,以至很容易最终事与愿违。他们认为,面试表现比平均绩点高更有说服力,面试会比基于和候选人长期接触而产生的推荐信更能预测候选人在美国和平队的表现。
1701778020
1701778021
对于“面试”,我们应当明白:如果对于一个学校或一份工作的候选人来说,可以在他的申请材料中获取重要的、有价值的信息,那么最好不要再面试他了。如果你能够以面试真正具有的并不那么重要的价值来衡量它,那么它就不可能真的影响你的判断。然而,我们几乎无法抑制自己要过度看重面试的倾向,因为我们对于通过直接观察一个人而了解其能力和品性有着不切实际的自信。
1701778022
1701778023
这就像是我们将面试中对某个人的印象看作对他进行了全息摄影的结果——只有一些微小的、模糊的结果是可以确定的,但是那并不是一个人完整的样子。我们应当把面试看作对一个人进行了解的微小的、碎片化的,甚至可能是有所偏差的侧面。想想盲人摸象的故事,你应该不想成为其中的一个盲人吧。
1701778024
1701778025
面试错觉和基本归因谬误同出一源,它们都是我们将所获取的不完整的信息夸大的结果。进一步来说,基本归因谬误就是我们高估了一些确定性的性格因素而忽视了环境因素,这会让我们对于面试中获得的信息产生怀疑。更好地理解大数定律有助于我们避免更多的基本归因谬误,并减少面试错觉。
1701778026
1701778027
我希望我能说自己对于面试有效性的知识会常常让我质疑自己基于面试而得出的结论。然而,效果真的有限。那种我自以为有价值的知识导致错觉的力量十分强大。我不得不严肃提醒自己不要太看重面试——或者其他通过短时间接触就下结论的情形。这一点在我能从其他途径(他人在长期接触中对某人形成的印象、学术记录或者工作成就)获得更充分信息时尤其重要。
1701778028
1701778029
当然,我会很容易就记住你在面试中表现出的非常有限的判断力!
1701778030
1701778031
离散与回归
1701778032
1701778033
我有一个朋友凯瑟琳,她的工作是为医院进行管理实务的咨询。她十分热爱自己的工作,一部分原因是她可以借工作之便去各地旅行,结识新的朋友。她对美食情有独钟,总会去那些受到高度认可的餐厅体验。然而,她常常抱怨,当她第二次再去那些起初觉得好的餐厅时,却再也品尝不到当日的美味了。你觉得原因是什么呢?
1701778034
1701778035
如果你说“可能是厨师极大地改变了烹饪方法”,或者猜测“可能是她的期待太高了,以至实际情况会让她失望”,那么,你就忽略了一些重要的统计学的因素。
1701778036
1701778037
以一种统计学的视角来看待这个问题,那么你首先应当想,凯瑟琳在任何一个场合、任何一家餐厅吃到特别美味的食物总存在一种偶然因素。当一个人在不同情形下在同一家餐厅吃饭,或是一群食客于某一个时间在某家特定的餐厅吃饭,人们对于好吃与否的评断标准都会存在差异。凯瑟琳在某家餐厅吃到的第一顿饭可能只是马马虎虎(甚至更糟糕),也可能极其美味。这种变化便是我们评断食物质量的变量。
1701778038
1701778039
任何连续的变量(会存在从一个极端到另一个极端的连续完整值域,比如身高),和与它相反的非连续变量(比如性别或是政治倾向)相比,都会有一个均值和一个围绕均值分布的值域。基于这一点,我们就不难理解凯瑟琳总会感到失望:有时她第二次去同一家餐厅的体验会比第一次差,这几乎是必然的(当然有时候第二次的体验会好于第一次)。
1701778040
1701778041
但是我们还要进一步分析。我们可以预期,凯瑟琳对一家之前有着不错印象的餐厅的看法会改变,认为它不如从前了。这是因为,越是接近一个给定值的平均值,那么它就越会显得不出众。一个值距离均值越远,则那个值越珍贵。因此,如果她在场合1中吃到了美味的一餐,那下一餐就可能就没有那么美味(在值域上处于极端位置)了。这对于所有符合正态分布定义的变量都是成立的,该曲线被称作“钟形曲线”,如下图所示。
1701778042
1701778043
正态分布是一种数学上的抽象表示,但是其形态时常惊人地近似于连续变量的分布——每周由不同母鸡下的鸡蛋数量,每周制造的汽车变速器中出现的差错数量,人们的智商分数分布几乎都近似于正态分布。没有人知道这究竟是为什么,但这的确是事实。
1701778044
1701778045
有许多种方式可用于描述在均值周围分布的样本的离散情况。其中一种是值域,即在可见样本范围内用最高值减去最低值。一种更有用的描述离散情况的工具是以均值为基准而产生的平均离差。如果凯瑟琳在不同城市的餐厅品尝的第一顿美餐的平均质量是“非常好”,而均值的平均离差分别为“很高”(高的一边)和“一般好”(低的一边),那么我们会说针对凯瑟琳第一顿美餐的质量均值而产生的平均离差(离散程度)不算非常大。如果平均离差的范围是从“极好”到“极普通”,那么我们认为离散程度很大。
1701778046
1701778047
1701778048
1701778049
1701778050
智商得分的正态分布图,均值为100,图中展示了对应的标准差和百分等级
1701778051
1701778052
当然,还有相当多的有效测量离散情况的方法,我们可以借此计算任何变量,它们可以被赋予连续的数值。这就是标准差(或者称作SD,可以用希腊字母δ表示)。标准差应当是数据集中的每一个数据与均值的离差平方的算术平均数的平方根。从概念上讲,它不同于平均离差,但是标准差有一些极其有用的属性。
1701778053
1701778054
图中的正态曲线被标准差划分成几部分。大约有68%的值分布在距离均值正负一个标准差的值域内。以智商测试分数为例。大多数智商测试是以具体分数为结果的,因此平均值常被设定为100,而标准差为15。若一个人的智商测试得分为115,则他比平均得分高出了一个标准差。均值和比均值高一个标准差的值的差距是相当大的。一个智商测试得分为115的人被认为可以完成大学学业,甚至能完成一些研究生层次的学业。社会中的典型职业分为专业类的、管理类的和技术类的。一个智商测试得分为100的人大多只会完成一些社区大学或大学预科课程的学业,有时只完成高中课程要求就足够了,而他们未来的职业主要是商店经营者、职员或者商人。
1701778055
1701778056
另一个有关标准差的有效事实是百分位数值与标准差之间的关系。找到比均值高一个标准差的点,大约有83%的样本值都比该点表示的值要小(在图中对应区域为自“+1δ”点向左)。正巧在比均值高一个标准差的那个点上的值在整个正态分布中的排位为前16%。剩下的16%的样本值高于这84%的值。有几乎98%的样本值落在比均值高两个标准差的点的左侧(即小于“均值+2δ”)。正好落在“均值+2δ”点上的值在整个值域中的排位为前2%,即只有剩下的2%的值大于它。几乎所有的值都会落在距离均值正负三个标准差的区间里。
1701778057
1701778058
了解了标准差与百分等级之间的关系可以帮助我们判断生活中遇到的大部分连续变量的情况。例如,标准差常被用作金融领域的一个测量指标。一项投资的收益率的标准差被用于测量投资的波动性。如果一只特定的股票在过去10年中的平均收益率为4%,其标准差为3%,这意味着,你能做出的最接近实际的猜测为:在未来,在68%的时间当中,收益率会是1%~7%;在96%的时间当中,收益率会是–2%~10%。这种情况会很稳定。你不会因此暴富,但也不大可能因为股票暴跌而贫民窟。如果标准差为8%,那么在68%的时间当中收益率会是–4%~12%。你可能会因为这只股票大赚一笔。有16%的时间里你将会拿到12%以上的收益率。另一方面,有16%的时间你的损失也会达到4%以上。这是很容易发生的。有2%的时间你的损失可能会达到12%以上,有2%的时间你的收益又会达到20%以上。你可能会突然间赚大钱,也可能穷得连衬衫也穿不起。
1701778059
1701778060
所谓的价值型股票是那些在收益和损失的变动性上都很低的股票。它们可能每年只需你付出2%、3%或4%的股息,既不会在牛市时上涨得太多,也不会在熊市时下跌得过多。所谓的增长型股票则是其收益之间存在很大标准差的股票,即同时具有股价飙升的潜力和股价暴跌的风险。
1701778061
1701778062
金融顾问一般会建议年轻的投资者选择增长型股票,并且在熊市和牛市时都坚持不抛售,因为在较长时间段内增长型股票总是能化险为夷,最终增长。而对于年长的投资者,顾问们则建议他们尽量购入价值型股票,这样就避免了在正逢退休之时被熊市套牢。
1701778063
1701778064
有趣的是,你刚才读到的各类正态分布曲线都有其独特的形状,只有时候会像“钟形曲线”。曲线的峰态(凸出的部分)形状迥异。尖峰态曲线(狭窄型)看上去像20世纪30年代漫画书上的火箭舱体,有着高峰顶和较短的尾部。扁峰态曲线(宽阔的)则像是一条吞下了大象而腹部鼓起的蟒蛇,它有着低峰顶和较长的尾部。然而,无论是哪种形状的曲线,只要是符合正态分布,就会有68%的样本值落在距均值正负一个标准差的区域里。
1701778065
1701778066
1701778067
[
上一页 ]
[ :1.701778018e+09 ]
[
下一页 ]