1702643560
1702643561
我承认,刚刚的这个例子是奇怪了一些,但其中反映的问题是真实、严肃的。《纽约时报》曾发表了一篇关于抗抑郁药物药效发表性偏见的文章,第一句话就是:“抗抑郁药百忧解、帕罗西汀等产品的生产商故意不发表更多的药物试验结果,就是为了获得政府许可,误导医生和消费者对药物真实效果的看法。”那些证明这些药物对治疗抑郁症有效的研究中有94%都得到了发表,而发现这些药物无效的研究中只有14%被发表在相关刊物上。对于抑郁症患者来说,这样的发表性偏见确实会造成误导。如果将所有研究成果进行综合考虑,其实抗抑郁药造成误导的效果只比安慰剂(外观与抗抑郁药相同,给对照组服用,不含任何药物成分)略好。
1702643562
1702643563
为了解决这一问题,如今的医学杂志要求所有研究在刚开始时通过项目注册的方式予以告知,否则将取消其出版的资格,杂志编辑可以借此得出某项研究的肯定和否定结论的比例。例如就滑板运动和心脏病的关系这一课题,总共有100项注册研究项目,最后只有一项得到了肯定结论并要求出版,那么杂志编辑就可以推导出剩下的99个项目都得出了否定结论(或者至少他们可以对这一概率进行调查)。
1702643564
1702643565
记忆性偏见。回忆确实很神奇,但并不是优质数据的可靠来源。我们总是认为现在和过去是有逻辑联系的——有因才有果,这符合人类的思考方式。但问题是,当我们试图解释当前一些特别好或特别坏的结果时,我们的记忆便会出现“系统脆弱”的尴尬。1993年,一位哈佛大学的研究人员进行了一项关于饮食习惯和癌症关系的研究,他收集了两组女性的饮食习惯数据,一组对象为被诊断出患有乳腺癌的女性,另一组对象则由年龄相仿的健康女性组成,通过对她们早年的饮食习惯进行对比研究发现:患有乳腺癌的女性在年轻时喜欢吃高脂肪含量食物的人数明显偏多。
1702643566
1702643567
但实际上,这项研究并不能揭示饮食习惯和癌症之间的关系,仅仅只是告诉我们癌症是如何影响一个女人对她早期饮食习惯的记忆的。所有参与研究的女性在
1702643568
1702643569
几年前都接受了一个关于饮食习惯的调查,那时她们中间还没有一个人被诊断出患有癌症。一个令人震惊的发现是,患有乳腺癌的女性在回忆她们的饮食构成时,食物的脂肪含量明显上升了,甚至比她实际摄入的要高得多;而没有患上乳腺癌的女性则没有这一倾向。《纽约时报》是如此形容这一记忆性偏见的“阴险本质”的:
1702643570
1702643571
一纸乳腺癌的诊断书不仅改变了一个女性的现在和未来,还改变了她的过去。患有乳腺癌的女性(无意识地)认为摄取过多高脂肪含量食物的饮食习惯极有可能是她们患病的罪魁祸首,因此她们的记忆(无意识地)认为自己过去摄入了太多高脂肪含量的食物。了解这一疾病历史的人,对于这样的一种思维方式是再熟悉不过了:这些女性与千万女性一样,不断回忆过去想要从中找到一个患病原因,然后再将这个原因植入记忆。
1702643572
1702643573
没有记忆性偏见是纵向研究优于横向研究的一个方面。纵向研究的数据都是基于当前收集的,当研究对象5岁的时候,我们会问他对于上学的看法,13年之后,我们可以对其进行回访,看看他是不是从高中辍学了。横向研究的所有数据都是在某一个时间点上截取的,我们只能问一个18岁的高中缀学生当他5岁的时候对于上学持哪种态度,这位研究对象的回答必然没有13年前那么可靠和真实。
1702643574
1702643575
幸存者偏见。假设一位高中校长对外宣称学校里有一批学生的考试分数在过去4年中稳步提高(美国的高中为4年制),他们读高二时的考试分数比高一刚入校时的分数高,高三时的考试成绩再创新高,当然高四时的考试成绩又是高中四年中最好的。在这一过程中保证不存在弄虚作假行为,甚至没有任何对描述性数据的“创新使用”。这批学生每一年的成绩在平均分、中位数、高分段的学生比例等各方面都优于上一年。你是会提名该校长为“年度校长”,还是会要求他提供更多的数据?
1702643576
1702643577
我当然会选择后者,因为我嗔到了“幸存者偏见”的味道。当样本中有一些或许多数据缺失,导致样本组成发生改变,从而影响分析的结果时,幸存者偏见就出现了。让我们来假设这是一个不合格的校长,他的学生不学无术,每年都有1/2的学生辍学,虽然没有一个学生有真正的进步,但这对于学校的总体成绩来说其实是一件非常有利的事。一个最符合事实的假设是,成绩最差的学生最有可能成为辍学大军中的一员,随着越来越多这类学生离开学校,剩下的学生的平均成绩自然会逐渐上升。这就像一个房间里站满了身高不等的人,让较矮的人离开自然会让房间里的人的平均身高上升,但实际上没有一个人长高了。
1702643578
1702643579
共同基金正是(阴险地)死死地抓住了幸存者偏见,来使自己的业绩看上去比实际上要好。共同基金通常会将它们的表现与股票市场的某个关键基准进行比较,如标准普尔500指数,这是一个由美国500家行业内领先的上市公司构成的股票指数。如果某年标准普尔500指数上升了5.3个百分点,某只共同基金便会宣称自己的涨幅超过了标准普尔500指数的涨幅;如果标准普尔500指数在这一年出现了下跌,那么共同基金便宣称自己的跌幅低于标准普尔500指数。如果作为投资者的你不想花钱请一个共同基金经理,那么一个低廉、便捷的选择就是买入标准普尔500指数基金,这也是一种共同基金,只不过投资的股票是标准普尔500指数包含的这500家公司。共同基金经理们总是觉得自己是精明的投资人,有能力运用他们的知识在茫茫股海中挑出那些表现优于指数基金的股票。但事实上,要想一直战胜标准普尔500指数,并不是一件容易的事。标准普尔500指数基本上是所有交易中的大型股票的平均值,因此从数学的角度来思考,我们可以预期有1/2的管理活跃的共同基金的表现会超过标准普尔500指数,1/2的共同基金的表现不如标准普尔500指数。当然,如果输给了一个完全不用思考、只需要买进500只股票并持有它们的指数基金,共同基金经理们自然会觉得丢脸,因为前者既不需要投资分析,也没有炫目的宏观预测机制,而且更让投资者欢呼雀跃的是,还没有高额的管理费。
1702643580
1702643581
传统意义上的共同基金公司一般都会怎么做呢?操纵数据是永远的“救心丸”!下面就来说说,它们是如何在没有跑赢市场的情况下“跑赢市场”的。某家大型共同基金公司会同时开放许多只共同基金(有专家专门负责挑选股票,通常会有一个特定的关注点或策略),举个例子,假设一家共同基金公司开放了20只新基金,其中每只基金跑赢标准普尔500指数的概率都约为50%(这一假设与长期数据是吻合的)。现在,基础概率学告诉我们,该公司第一年只有10只新基金的表现能够打败标准普尔500指数,连续两年打败标准普尔500指数的基金为5只,连续3年打败标准普尔500指数的基金只剩下了2〜3只。
1702643582
1702643583
最精彩的内容马上就要来了。届时,那些相比标准普尔500指数收益率不够理想的共同基金基本上都已经被悄无声息地关闭了(它们的剩余资产都被并入其他现有的基金中)。该公司接下来就可以大肆打广告,宣传这两三只“表现始终优于标准普尔500指数”的基金了,而实际上,它们在这3年的良好表现就相当于连续抛3次硬币都得到正面朝上的结果一样。它们接下来的表现很有可能会回归平均值,但此时投资者的钱已经被成功地骗进来了。真正能够在相当长一段时间里,对标准普尔500指数保持不败战绩的共同基金或投资专家少得可怜。
1702643584
1702643585
健康用户偏见。定期服用维生素的人更有可能不受疾病的困扰,因为他们就是那类定期服用维生素的人!至于维生素到底对他们的健康有多大帮助,那就是另外一回事了。下面有这样一个思维实验,假设公共卫生官员发布一个理论:所有家长都应该给他们刚出生的孩子穿上紫色睡衣睡觉,因为这会刺激孩子的大脑发育。20年后,纵向研究证实,穿紫色睡衣睡觉的孩子更有可能在人生中获得成功。举例说明,我们发现在哈佛大学学习的大一新生中,有高达98%的人在孩童时期(甚至到现在)都穿着紫色睡衣入睡;而在马萨诸塞州州立监狱系统内的犯人中,只有3%的人有穿紫色睡衣入睡的童年经历。
1702643586
1702643587
紫色睡衣当然不会有什么作用,真正起作用的是给他们的孩子穿上紫色睡衣的家长。即使我们意识到在研究过程中要对家庭教育等因素进行控制,我们还是没办法做到面面俱到,尤其是诸如给孩子穿什么颜色的睡衣这样的细微差别,但那些着迷于给孩子穿上紫色睡衣和从没想到要这样做的两类家长之间是存在区别的。正如《纽约时报》健康专栏作家加里•陶布斯所解释的那样:“就从最简单的角度来分析,那些忠于健康生活方式的人——按时吃药、保持健康的饮食习惯等——与其他人有本质区别,这就是问题所在。”对于那些试图揭示某些活动(如定期运动或喝蔬菜汤等)是否对健康有益的研究来说,这样的一种偏见可能会使结论变得没有那么清晰。我们觉得自己所比较的只是某种单一的饮食差异——喝蔬菜汤和不喝蔬菜汤,但事实上,如果处理组和控制组的成员没有实现完全的随机取样,我们所比较的就是两类不同的人了:习惯喝蔬菜汤的那一组人拥有健康的生活习惯,而不习惯喝蔬菜汤的人可能在生活的其他方面也忽略健康习惯。
1702643588
1702643589
如果把统计学比作侦探工作,那么数据就是线索。我的妻子在新罕布什尔州的一个小镇当了1年的高中教师,她的一个学生有一天因为潜人五金店偷工具被抓起来了。警方之所以能够破案,是因为案发当天刚下过雪,从五金店到那个学生家这段距离的雪地上留有脚印;丢失的工具在学生的家中被找到。可见,好的线索的作用有多大。
1702643590
1702643591
优质的数据就是好的线索,但首先我们必须收集到优质数据,而这要比看上去困难得多。
1702643592
1702643593
1702643594
1702643595
1702643597
赤裸裸的统计学:除去大数据的枯燥外衣,呈现真实的数字之美 第9章 中心极限定理
1702643598
1702643599
一辆坐满肥胖乘客的抛锚客车停在你家附近的路上,你推断下,它的目的地是马拉松比赛场地,还是国际香肠节展厅?
1702643600
1702643601
有时候统计学就像魔术一样,能够从少量数据中得出不可思议的强大结论。我们只需要对1000个美国人进行电话调查,就能洞悉美国总统大选的得票数,我们通过对一家禽肉加工厂生产的100块鸡胸肉进行沙门氏菌检测,就能得出这家工厂的所有肉类产品是否安全的结论。这些“一概而论”的强大能力,到底是从哪里来的?
1702643602
1702643603
绝大部分来自中心极限定理,或者说统计学界的勒布朗•詹姆斯,勒布朗同时还是超级模特、哈佛大学教授和诺贝尔和平奖获得者。中心极限定理是许多统计活动的“动力源泉”,这些活动存在着一个共同的特点,那就是使用样本对一个更大的数量对象进行推理(比如民意调查或是沙门氏菌检测)。这类推理看上去似乎充满神秘感,但事实上,它们只是我们已经探讨过的两个工具相结合的产物,这两个工具是概率和抽样调查。在开始对中心极限定理的工作机制进行介绍之前(其实也没有那么难以理解),我们先来看一个例子,让大家有一个大致感受。
1702643604
1702643605
假设你所生活的城市正在举办一场马拉松比赛。来自世界各国的运动员们齐聚一堂,准备一决高下,但他们中的许多人都不会说英语。按照比赛组委会的安排,
1702643606
1702643607
每位运动员在比赛当天的早上签到之后,会被随机分配到一辆驶往起点的长途客车。不凑巧的是,其中的一辆长途客车没有按规定到达比赛现场,为了省去大量额外的运算,我们假设这辆客车上没有一个人有手机,而且车里也没有装载全球定位系统(GPS)设备。作为市民中的一员,你加入了搜寻长途客车的队伍。
1702643608
1702643609
偏偏就那么巧,在你家附近有一辆抛锚的长途客车,车上坐着一大群面露不快的国际乘客,他们中没有一个人会说英语。这肯定就是那辆失踪的车,你将会成为这座城市的英雄!但就在此时,一个疑惑出现在你的脑中:这辆车上的乘客看上去都“不瘦”,准确地说,他们都很胖。粗略扫一眼这些人,你估计这些乘客的平均体重至少有220磅(100公斤)。随机分配的马拉松运动员的体重不可能这么重,你打开对讲机对搜寻总部汇报道:“不是这辆客车,请继续搜寻。”
[
上一页 ]
[ :1.70264356e+09 ]
[
下一页 ]