打字猴:1.701778048e+09
1701778048
1701778049
1701778050 智商得分的正态分布图,均值为100,图中展示了对应的标准差和百分等级
1701778051
1701778052 当然,还有相当多的有效测量离散情况的方法,我们可以借此计算任何变量,它们可以被赋予连续的数值。这就是标准差(或者称作SD,可以用希腊字母δ表示)。标准差应当是数据集中的每一个数据与均值的离差平方的算术平均数的平方根。从概念上讲,它不同于平均离差,但是标准差有一些极其有用的属性。
1701778053
1701778054 图中的正态曲线被标准差划分成几部分。大约有68%的值分布在距离均值正负一个标准差的值域内。以智商测试分数为例。大多数智商测试是以具体分数为结果的,因此平均值常被设定为100,而标准差为15。若一个人的智商测试得分为115,则他比平均得分高出了一个标准差。均值和比均值高一个标准差的值的差距是相当大的。一个智商测试得分为115的人被认为可以完成大学学业,甚至能完成一些研究生层次的学业。社会中的典型职业分为专业类的、管理类的和技术类的。一个智商测试得分为100的人大多只会完成一些社区大学或大学预科课程的学业,有时只完成高中课程要求就足够了,而他们未来的职业主要是商店经营者、职员或者商人。
1701778055
1701778056 另一个有关标准差的有效事实是百分位数值与标准差之间的关系。找到比均值高一个标准差的点,大约有83%的样本值都比该点表示的值要小(在图中对应区域为自“+1δ”点向左)。正巧在比均值高一个标准差的那个点上的值在整个正态分布中的排位为前16%。剩下的16%的样本值高于这84%的值。有几乎98%的样本值落在比均值高两个标准差的点的左侧(即小于“均值+2δ”)。正好落在“均值+2δ”点上的值在整个值域中的排位为前2%,即只有剩下的2%的值大于它。几乎所有的值都会落在距离均值正负三个标准差的区间里。
1701778057
1701778058 了解了标准差与百分等级之间的关系可以帮助我们判断生活中遇到的大部分连续变量的情况。例如,标准差常被用作金融领域的一个测量指标。一项投资的收益率的标准差被用于测量投资的波动性。如果一只特定的股票在过去10年中的平均收益率为4%,其标准差为3%,这意味着,你能做出的最接近实际的猜测为:在未来,在68%的时间当中,收益率会是1%~7%;在96%的时间当中,收益率会是–2%~10%。这种情况会很稳定。你不会因此暴富,但也不大可能因为股票暴跌而贫民窟。如果标准差为8%,那么在68%的时间当中收益率会是–4%~12%。你可能会因为这只股票大赚一笔。有16%的时间里你将会拿到12%以上的收益率。另一方面,有16%的时间你的损失也会达到4%以上。这是很容易发生的。有2%的时间你的损失可能会达到12%以上,有2%的时间你的收益又会达到20%以上。你可能会突然间赚大钱,也可能穷得连衬衫也穿不起。
1701778059
1701778060 所谓的价值型股票是那些在收益和损失的变动性上都很低的股票。它们可能每年只需你付出2%、3%或4%的股息,既不会在牛市时上涨得太多,也不会在熊市时下跌得过多。所谓的增长型股票则是其收益之间存在很大标准差的股票,即同时具有股价飙升的潜力和股价暴跌的风险。
1701778061
1701778062 金融顾问一般会建议年轻的投资者选择增长型股票,并且在熊市和牛市时都坚持不抛售,因为在较长时间段内增长型股票总是能化险为夷,最终增长。而对于年长的投资者,顾问们则建议他们尽量购入价值型股票,这样就避免了在正逢退休之时被熊市套牢。
1701778063
1701778064 有趣的是,你刚才读到的各类正态分布曲线都有其独特的形状,只有时候会像“钟形曲线”。曲线的峰态(凸出的部分)形状迥异。尖峰态曲线(狭窄型)看上去像20世纪30年代漫画书上的火箭舱体,有着高峰顶和较短的尾部。扁峰态曲线(宽阔的)则像是一条吞下了大象而腹部鼓起的蟒蛇,它有着低峰顶和较长的尾部。然而,无论是哪种形状的曲线,只要是符合正态分布,就会有68%的样本值落在距均值正负一个标准差的区域里。
1701778065
1701778066
1701778067
1701778068
1701778069 现在让我们再回到凯瑟琳的问题上,为什么她总会对自己开始评价甚高的餐厅的美食感到失望呢?我们已经明白,她对餐厅中的食物的具体评价是不断变化的:比如从“极其厌恶”(1%的排位)到“极其喜爱”(99%的排位)。假设凯瑟琳吃了一顿饭,认为它在自己的评价体系中的排位达到95%或者更高,即比她吃过的94%的饭都美味。现在,请大家就自己的吃饭经历问自己以下问题:是否认为有很大的可能性,所有你第一次吃到的餐饭都会是特别美味的,或者其中只有一些是特别美味的?如果你认为自己不会期待所有的饭都会特别美味,那么对于第二顿饭的期待值就至少会比极其美味的第一顿饭低一点儿。
1701778070
1701778071 有关凯瑟琳的第二顿饭的体验可以被看作样本向均值回归的一个范例。如果人对于饭的感受(喜爱程度)呈正态分布,极端值几乎不存在,因此紧跟着极端值的某一次特定感受会低于极端值。这样,最极端的情况就往低于极端的方向上回归了。
1701778072
1701778073 回归效应在日常生活中随处可见。为什么今年的棒球新人总是在来年表现得令人失望?因为,新人在第一年的表现是偏离其真分数的离散值,第二年他别无选择,只会表现得逊色。为什么在第一年增值超越其他股票的股票常在第二年表现得平庸很多,甚至更糟糕?原因还是“回归”。为什么在三年级表现最差的孩子在下一年反而表现得好了一些?依然是“回归”。以上这些例子并不是说事物的走势只有回归这一种。均值的分布并不是一个黑洞,能把所有的极端值都吞没。还有其他一些因素在同时发挥作用,让事物发展得更好或者更糟。虽然我们还不知道形成正态分布的确切原因,但是我们需要明白,极端值之下总是有不那么极端的值跟随着,因为在综合因素的作用下,极端值不会一直维持原状。今年的棒球新人恰好有一位发挥得异常出色的教练来调教他;在今年的一系列比赛中,这位新人遇到的对手都相对较弱;他在今年正好和自己心爱的女孩订婚了;他的身体健康状态堪称完美;他没有受到任何伤病的困扰,等等。而在下一年,他因为肘部受伤而缺席了好几场比赛;那位优秀的教练去了其他球队;他的家人患上了严重的疾病,等等。生活中总是有各种不可预知的事情发生。
1701778074
1701778075 下面有两个与回归原则相关的问题(可能会令人惊讶):第一,一个年龄在25~60岁的美国人在某一年成为全美收入最高的1%的人中的一员的概率是多少?第二,一个人连续10年成为全美收入最高的1%的群体中的一员的概率是多少?
1701778076
1701778077 你可能无法想象,在美国,一个人成为收入最高的1%的群体中的一员的概率为11%,而一个人连续10年跻身该群体的概率为6‰。这还只是某一年的情况。这些概率数字变化令人震惊,因为我们不会自发地想到,像收入这种事情的变化性会这么高,并且易受到回归效应影响。但是,个人收入在多年中的分布情况也有很大变动性(尤其是收入分布的高点上)。极端收入在人口总体中出现得极少。而正是由于它们极端,所以它们不太可能会反复出现。因此,那些令人讨厌的1%的最高收入群体中的大部分人其实都在走下坡路,这样你可能会善待他们一些!
1701778078
1701778079 同样类型的数据也适用于低收入群体。超过50%的美国人在一生中至少会有一次变得贫穷,或者进入类似的状态。相反,并没有那么多人会在贫困中度过一生。一直靠领取救济金度日的人也极少。那些一度需要依赖社会保障生活的群体中的绝大部分人只会在几年中是这种状态。说到这里,你也许要对这些生活困顿的人多一点儿好感了。
1701778080
1701778081 我们可能因为不会利用“向均值回归”的框架分析事情而犯下许多严重的错误。心理学家丹尼尔·卡尼曼曾告诉一群以色列飞行教官,如果想改变一个人的行为倾向,那么赞扬比批评有效得多。有一位教官反驳卡尼曼,他说赞扬一个飞行员差劲的演习行动会使他表现得更糟糕,相反,训斥这个表现差劲的飞行员会让他在下次演习中有所提升。然而,这位教官忽略了新手飞行员的发挥是不稳定的,在一次完美的飞行训练之后,他的表现会有“向均值回归”的趋势,或者甚至会有更糟糕的表现。从概率的角度来看,在一次上佳表现之后,下次顶多可以期待他会有接近于平均值的表现;在一次糟糕的表现之后,则可以期待下次会好一些。
1701778082
1701778083 如果教官建立了表现是连续变量的概念,即一次极端值之后只可能出现接近极端值的状况,那么他多半只会看到他的学生下一次的表现更糟糕。他必须强化积极方面,以求学生有好于平均水平的表现,让自己成为一个更好的导师。
1701778084
1701778085 飞行教官所犯的错误会因为我们都有的一把认知的双刃剑而变得更严重。我们都是卓越的因果关系制造者。如果存在一个结果,我们几乎都能找到解释。
1701778086
1701778087 随着时间推进,我们由观察到的不同结果,都能很容易地给出因果解释。然而大多数情况下,其实事情发展并没有我们强加的这种因果——它只是随机发生的。当我们已经习惯于看到一件事发生之后接连会发生另一件事时,这种强加因果的倾向就越发强烈。看到这种关联我们几乎会自发地进行因果解释。如果我们能对这种进行因果解释的行为保持警惕,那么我们将会获益匪浅。但是,这里仍有两个问题:第一,解释来得太容易了,如果我们能意识到自己制造这种因果关联有多么草率,我们就会对它不那么相信了;第二,在大多数情况下,如果我们对随机性的概念有更深的了解的话,因果解释就会显得很不恰当,甚至我们都不会做出这样的解释。
1701778088
1701778089 让我们再举几个应用回归原理的例子。
1701778090
1701778091 如果一个孩子的母亲的智商是140,其父亲的智商是120,那么你认为这个孩子的智商最有可能是多少?
1701778092
1701778093 160 155 150 145 140 135 130 125 120 115 110 105 100
1701778094
1701778095 精神治疗师会对许多病人提及“前恭后敬效应”(hello/goodbye effect)。对于病人讲述病情而言,治疗开始前,他们的实际病情没有他们说的那么糟,而治疗结束后,他们的实际病情也没有他们说的那么好,这是为什么?
1701778096
1701778097 如果你说这个孩子的智商——父母两人一方智商为140,另一方为120——会达到140或更高,那么你并没有考虑向均值回归的现象。120的智商是高于常人平均水平的,而140也是高过平均值的。除非你认为父母的智商完全决定了孩子的智商,否则你就得预测这个孩子的智商水平会低于父母智商的平均值。因为父母智商平均值和孩子的智商的相关性为0.50(我想你可能不知道这一点),因此孩子的智商值应该为父母智商平均值和全部人口智商平均值的中间值,即115。超级聪明的父母生出的孩子也仅仅是一般聪明而已。不过,超级聪明的孩子的父母的智商也可能只达到一般水平。回归是双向发挥作用的。
[ 上一页 ]  [ :1.701778048e+09 ]  [ 下一页 ]