打字猴:1.70264354e+09
1702643540
1702643541 选择性偏见。据说《纽约客》的资深影评人宝琳•凯尔在理查德·尼克松当选美国总统之后曾发表过这样的看法:“尼克松不可能赢,我认识的人都没有投票给他。”虽然这句话可能不是宝琳的,但至少能说明一点:一个不合格的样本(宝琳的自由派朋友圈)会对整个人口(全美国的选民)产生一个误导性的简单印象。这就引出了一个我们应该时常问自己的问题:在给出评价之前,我们是如何选择样本的?如果人口中的每一个人被选入样本的概率不是均等的,那么由这样一个样本推导出的结论就会存在问题。爱荷华州的民意测验是每届美国总统选举的传统事务,在大选年8月的某天,共和党的几位党内候选人会造访爱荷华州的艾姆斯,为吸引选民造势,有意愿的选民需要购买一张30美元的入场券来到现场进行投票。但是,爱荷华州的这场民意测验结果与共和党即将诞生的总统候选人并没有多大关系(在过去的5届总统大选中,爱荷华州的民意测验只预测对了3位候选人),这是为什么呢?因为花30美元来到现场的爱荷华人并不能代表爱荷华州的其他共和党人,而爱荷华州的共和党人也不能代表美国其他州的共和党人。
1702643542
1702643543 选择性偏见也会以其他方式呈现。一个针对某一机场消费者展开的调查肯定是存在偏见的,因为选择乘飞机出行的人一般来说会更加富有一些,而在90号州际公路旁的一个休息点展开的调查,可能会存在与机场调查结果相反的问题。此外,由于愿意在公共场合接受采访的人与不喜欢被打扰的人之间也是有差别的,因此这两个调查都有可能存在先天的偏见。假如你在一个公共场合询问100个人是否愿意接受一个小调查,其中有60人表示愿意回答你的问题,那么这60人与剩下的那些匆匆经过你身边、拒绝跟你有眼神接触的40人之间,可能在某些方面存在着巨大差别。
1702643544
1702643545 1936年,《文学文摘》主办的民意测验可谓是史上知名度最高的统计错误,其根源就是一个存在偏见的样本。那一年,共和党人、堪萨斯州州长阿尔夫•兰登竞选美国总统,他的民主党对手是寻求连任的富兰克林•罗斯福。《文学文摘》作为当时影响力颇大的新闻周刊,向该杂志的订阅者以及能够从公共档案中查到地址的汽车和电话主人寄去了一份调查问卷,总共加起来有1000万名美国公民收到了这份问卷,这个样本容量在当时算得上是天文数字了。对于民调来优质样本越大,结果就越准,因为误差在减小;但是如果样本本身存在问题,那么民调规模越大,“垃圾”就会越堆越多、越堆越臭。《文学文摘》预测兰登将会以57%的支持率击败罗斯福赢得选举,而事实又怎么样呢?罗斯福获得了60%的选民投票以及多达46个州(总共48个州)的支持,以压倒性优势赢得了选举。《文学文摘》的样本就是典型的“垃圾”:该杂志的订阅者们比普通美国人要富有,因此更有可能投票给保护富人利益的共和党,1936年家中就拥有汽车和电话的选民的投票情况也是如此。
1702643546
1702643547 在医药领域,如果在对实验对象划分实验组和对照组时,没有完全做到随机抽样,我们在比较两组结果时同样会遇到相同的基础性问题。以前列腺癌治疗为例,近期一本医学杂志刊登了治疗这类癌症所产生的副作用的相关发现。通常针对前列腺癌症患者有3种治疗方法:手术移除前列腺、放射治疗,或短程疗法(也就是将放射性“种子”植入癌细胞集中区域)。阳痿是前列腺癌治疗最常见的副作用,因此研究人员分别记录下参与3种治疗方法人群的性功能信息。在接受治疗的两年之后,一项针对1000名男性的调查结果发现,手术移除组有35%的男性能够进行性生活;放疗组能进行性生活的男性占37%;在接受短程疗法的男性患者中,有43%的人恢复了性生活。
1702643548
1702643549 我们能凭借这3个数据,得出短程疗法对男性性功能损伤最小的结论吗?当然不能!该研究报告的作者们明确警告说,由于接受短程疗法的患者通常较为年轻,健康状况也比接受另外两种疗法的病人要好,因此我们不能得出短程疗法对男性性功能损伤最小的结论。这项研究的目的仅是为了记录下每种治疗方法对性功能的损伤程度。
1702643550
1702643551 当样本中的个人主动提出要加入治疗组时,就出现了偏见的另一种形式,我们称为选择性偏见。例如,主动提出加入戒毒组的犯人与其他犯人是不同的,因为他们是主动要求加入这个组别的。即使通过跟进,发现戒毒组的成员在出狱之后再次人狱的概率要比没有参加戒毒组的犯人小,也丝毫不能证明戒毒组的存在价值。这些曾经的囚犯已经洗心革面地开始了全新的人生,我们可以说这是因为他们参加了戒毒组,但也有可能是因为其他因素恰好导致其有了主动申请加入戒毒组的愿望(比如产生了再也不想回到监狱的强烈欲望)。我们无法分离其中一种可能(戒毒组项目)与其他可能(成为一个主动申请加入戒毒项目的人)之间的因果关系。
1702643552
1702643553 发表性偏见。肯定性的研究发现相比否定性的研究发现来说,更有可能被发表,从而影响我们对事实真相的判断。假设你刚刚完成了一项严谨的纵向研究,得出玩电子游戏不能预防结肠癌的结论。你对一个包含10万美国人的代表性样本进行了长达20年的跟踪研究,发现每天花费数小时时间在电子游戏上的人得结肠癌的概率与那些不玩电子游戏的人基本相同。假定你的方法不存在任何瑕疵,那么哪一本享有声望的医学杂志会发表你的研究成果呢?
1702643554
1702643555 没有一本杂志会发表你的研究成果,原因有二。首先,玩电子游戏和患直肠癌之间在科学上并不存在强烈的相关性,因此你开展这项研究的出发点是什么并不明确。其次,也是本节重点要讲的,一个为“某因素不能预防癌症”的事实算不上是一个特别有趣的发现,毕竟有太多的因素都不能预防癌症。无论在医学还是其他领域,否定性的发现都显得单调乏味。
1702643556
1702643557 而这种发表性偏见将会导致研究结果的扭曲。假设你的研究生班的一个同学开展了一项不同的纵向研究,她发现每天花很多时间玩电子游戏的人患上直肠癌的概率确实低,这样的结论就有趣多了!只有这类发现才能吸引眼球,容易受到医学杂志、大众媒体、博客以及电子游戏厂商(它们肯定会在产品包装上贴上“玩本游戏有益健康”的标语)的关注。想必过不了多久,美国的“虎妈”们为了“保护”他们的孩子免受癌症的威胁,将纷纷从孩子的手里把课本抢过来,然后逼他们玩电子游戏。
1702643558
1702643559 对于统计学来说,巧合的存在决定了异常事情的发生,这是难以摆脱的事实。在100项完成的研究中,就有可能存在一项结论完全不值得信赖的情况,比如玩电游可以降低患直肠癌的风险这样的结论。但问题也随之而来:99项证明电游和直肠癌之间不存在任何联系的研究成果由于枯燥无趣,将不会得到发表;但剩下的那一项声称寻找到二者之间联系的论文会引起注意并最终得到发表,仅仅因为这样的结论是有趣的。偏见的来源并不是研究本身,而是那些能够接触到大众读者的信息载体,于是阅读科学杂志的人会读到这篇关于电子游戏和癌症的文章,在他们的眼里关于这个话题只有一项研究,而且这项研究证实玩电子游戏的确和癌症有关。事实上,有99%的研究证明二者并不存在联系。
1702643560
1702643561 我承认,刚刚的这个例子是奇怪了一些,但其中反映的问题是真实、严肃的。《纽约时报》曾发表了一篇关于抗抑郁药物药效发表性偏见的文章,第一句话就是:“抗抑郁药百忧解、帕罗西汀等产品的生产商故意不发表更多的药物试验结果,就是为了获得政府许可,误导医生和消费者对药物真实效果的看法。”那些证明这些药物对治疗抑郁症有效的研究中有94%都得到了发表,而发现这些药物无效的研究中只有14%被发表在相关刊物上。对于抑郁症患者来说,这样的发表性偏见确实会造成误导。如果将所有研究成果进行综合考虑,其实抗抑郁药造成误导的效果只比安慰剂(外观与抗抑郁药相同,给对照组服用,不含任何药物成分)略好。
1702643562
1702643563 为了解决这一问题,如今的医学杂志要求所有研究在刚开始时通过项目注册的方式予以告知,否则将取消其出版的资格,杂志编辑可以借此得出某项研究的肯定和否定结论的比例。例如就滑板运动和心脏病的关系这一课题,总共有100项注册研究项目,最后只有一项得到了肯定结论并要求出版,那么杂志编辑就可以推导出剩下的99个项目都得出了否定结论(或者至少他们可以对这一概率进行调查)。
1702643564
1702643565 记忆性偏见。回忆确实很神奇,但并不是优质数据的可靠来源。我们总是认为现在和过去是有逻辑联系的——有因才有果,这符合人类的思考方式。但问题是,当我们试图解释当前一些特别好或特别坏的结果时,我们的记忆便会出现“系统脆弱”的尴尬。1993年,一位哈佛大学的研究人员进行了一项关于饮食习惯和癌症关系的研究,他收集了两组女性的饮食习惯数据,一组对象为被诊断出患有乳腺癌的女性,另一组对象则由年龄相仿的健康女性组成,通过对她们早年的饮食习惯进行对比研究发现:患有乳腺癌的女性在年轻时喜欢吃高脂肪含量食物的人数明显偏多。
1702643566
1702643567 但实际上,这项研究并不能揭示饮食习惯和癌症之间的关系,仅仅只是告诉我们癌症是如何影响一个女人对她早期饮食习惯的记忆的。所有参与研究的女性在
1702643568
1702643569 几年前都接受了一个关于饮食习惯的调查,那时她们中间还没有一个人被诊断出患有癌症。一个令人震惊的发现是,患有乳腺癌的女性在回忆她们的饮食构成时,食物的脂肪含量明显上升了,甚至比她实际摄入的要高得多;而没有患上乳腺癌的女性则没有这一倾向。《纽约时报》是如此形容这一记忆性偏见的“阴险本质”的:
1702643570
1702643571 一纸乳腺癌的诊断书不仅改变了一个女性的现在和未来,还改变了她的过去。患有乳腺癌的女性(无意识地)认为摄取过多高脂肪含量食物的饮食习惯极有可能是她们患病的罪魁祸首,因此她们的记忆(无意识地)认为自己过去摄入了太多高脂肪含量的食物。了解这一疾病历史的人,对于这样的一种思维方式是再熟悉不过了:这些女性与千万女性一样,不断回忆过去想要从中找到一个患病原因,然后再将这个原因植入记忆。
1702643572
1702643573 没有记忆性偏见是纵向研究优于横向研究的一个方面。纵向研究的数据都是基于当前收集的,当研究对象5岁的时候,我们会问他对于上学的看法,13年之后,我们可以对其进行回访,看看他是不是从高中辍学了。横向研究的所有数据都是在某一个时间点上截取的,我们只能问一个18岁的高中缀学生当他5岁的时候对于上学持哪种态度,这位研究对象的回答必然没有13年前那么可靠和真实。
1702643574
1702643575 幸存者偏见。假设一位高中校长对外宣称学校里有一批学生的考试分数在过去4年中稳步提高(美国的高中为4年制),他们读高二时的考试分数比高一刚入校时的分数高,高三时的考试成绩再创新高,当然高四时的考试成绩又是高中四年中最好的。在这一过程中保证不存在弄虚作假行为,甚至没有任何对描述性数据的“创新使用”。这批学生每一年的成绩在平均分、中位数、高分段的学生比例等各方面都优于上一年。你是会提名该校长为“年度校长”,还是会要求他提供更多的数据?
1702643576
1702643577 我当然会选择后者,因为我嗔到了“幸存者偏见”的味道。当样本中有一些或许多数据缺失,导致样本组成发生改变,从而影响分析的结果时,幸存者偏见就出现了。让我们来假设这是一个不合格的校长,他的学生不学无术,每年都有1/2的学生辍学,虽然没有一个学生有真正的进步,但这对于学校的总体成绩来说其实是一件非常有利的事。一个最符合事实的假设是,成绩最差的学生最有可能成为辍学大军中的一员,随着越来越多这类学生离开学校,剩下的学生的平均成绩自然会逐渐上升。这就像一个房间里站满了身高不等的人,让较矮的人离开自然会让房间里的人的平均身高上升,但实际上没有一个人长高了。
1702643578
1702643579 共同基金正是(阴险地)死死地抓住了幸存者偏见,来使自己的业绩看上去比实际上要好。共同基金通常会将它们的表现与股票市场的某个关键基准进行比较,如标准普尔500指数,这是一个由美国500家行业内领先的上市公司构成的股票指数。如果某年标准普尔500指数上升了5.3个百分点,某只共同基金便会宣称自己的涨幅超过了标准普尔500指数的涨幅;如果标准普尔500指数在这一年出现了下跌,那么共同基金便宣称自己的跌幅低于标准普尔500指数。如果作为投资者的你不想花钱请一个共同基金经理,那么一个低廉、便捷的选择就是买入标准普尔500指数基金,这也是一种共同基金,只不过投资的股票是标准普尔500指数包含的这500家公司。共同基金经理们总是觉得自己是精明的投资人,有能力运用他们的知识在茫茫股海中挑出那些表现优于指数基金的股票。但事实上,要想一直战胜标准普尔500指数,并不是一件容易的事。标准普尔500指数基本上是所有交易中的大型股票的平均值,因此从数学的角度来思考,我们可以预期有1/2的管理活跃的共同基金的表现会超过标准普尔500指数,1/2的共同基金的表现不如标准普尔500指数。当然,如果输给了一个完全不用思考、只需要买进500只股票并持有它们的指数基金,共同基金经理们自然会觉得丢脸,因为前者既不需要投资分析,也没有炫目的宏观预测机制,而且更让投资者欢呼雀跃的是,还没有高额的管理费。
1702643580
1702643581 传统意义上的共同基金公司一般都会怎么做呢?操纵数据是永远的“救心丸”!下面就来说说,它们是如何在没有跑赢市场的情况下“跑赢市场”的。某家大型共同基金公司会同时开放许多只共同基金(有专家专门负责挑选股票,通常会有一个特定的关注点或策略),举个例子,假设一家共同基金公司开放了20只新基金,其中每只基金跑赢标准普尔500指数的概率都约为50%(这一假设与长期数据是吻合的)。现在,基础概率学告诉我们,该公司第一年只有10只新基金的表现能够打败标准普尔500指数,连续两年打败标准普尔500指数的基金为5只,连续3年打败标准普尔500指数的基金只剩下了2〜3只。
1702643582
1702643583 最精彩的内容马上就要来了。届时,那些相比标准普尔500指数收益率不够理想的共同基金基本上都已经被悄无声息地关闭了(它们的剩余资产都被并入其他现有的基金中)。该公司接下来就可以大肆打广告,宣传这两三只“表现始终优于标准普尔500指数”的基金了,而实际上,它们在这3年的良好表现就相当于连续抛3次硬币都得到正面朝上的结果一样。它们接下来的表现很有可能会回归平均值,但此时投资者的钱已经被成功地骗进来了。真正能够在相当长一段时间里,对标准普尔500指数保持不败战绩的共同基金或投资专家少得可怜。
1702643584
1702643585 健康用户偏见。定期服用维生素的人更有可能不受疾病的困扰,因为他们就是那类定期服用维生素的人!至于维生素到底对他们的健康有多大帮助,那就是另外一回事了。下面有这样一个思维实验,假设公共卫生官员发布一个理论:所有家长都应该给他们刚出生的孩子穿上紫色睡衣睡觉,因为这会刺激孩子的大脑发育。20年后,纵向研究证实,穿紫色睡衣睡觉的孩子更有可能在人生中获得成功。举例说明,我们发现在哈佛大学学习的大一新生中,有高达98%的人在孩童时期(甚至到现在)都穿着紫色睡衣入睡;而在马萨诸塞州州立监狱系统内的犯人中,只有3%的人有穿紫色睡衣入睡的童年经历。
1702643586
1702643587 紫色睡衣当然不会有什么作用,真正起作用的是给他们的孩子穿上紫色睡衣的家长。即使我们意识到在研究过程中要对家庭教育等因素进行控制,我们还是没办法做到面面俱到,尤其是诸如给孩子穿什么颜色的睡衣这样的细微差别,但那些着迷于给孩子穿上紫色睡衣和从没想到要这样做的两类家长之间是存在区别的。正如《纽约时报》健康专栏作家加里•陶布斯所解释的那样:“就从最简单的角度来分析,那些忠于健康生活方式的人——按时吃药、保持健康的饮食习惯等——与其他人有本质区别,这就是问题所在。”对于那些试图揭示某些活动(如定期运动或喝蔬菜汤等)是否对健康有益的研究来说,这样的一种偏见可能会使结论变得没有那么清晰。我们觉得自己所比较的只是某种单一的饮食差异——喝蔬菜汤和不喝蔬菜汤,但事实上,如果处理组和控制组的成员没有实现完全的随机取样,我们所比较的就是两类不同的人了:习惯喝蔬菜汤的那一组人拥有健康的生活习惯,而不习惯喝蔬菜汤的人可能在生活的其他方面也忽略健康习惯。
1702643588
1702643589 如果把统计学比作侦探工作,那么数据就是线索。我的妻子在新罕布什尔州的一个小镇当了1年的高中教师,她的一个学生有一天因为潜人五金店偷工具被抓起来了。警方之所以能够破案,是因为案发当天刚下过雪,从五金店到那个学生家这段距离的雪地上留有脚印;丢失的工具在学生的家中被找到。可见,好的线索的作用有多大。
[ 上一页 ]  [ :1.70264354e+09 ]  [ 下一页 ]