打字猴:1.702627784e+09
1702627784 看穿一切数字的统计学 [:1702626743]
1702627785 14 先放牛奶还是先放红茶?
1702627786
1702627787
1702627788
1702627789 正如前文中说过的那样,只对片面的数据进行交叉表统计,就连“因果关系的方向”都难以确定。
1702627790
1702627791 之前提到过的暴力游戏的游戏时间与犯罪率之间的关系,即使这两个项目在统计学上显示出非常明显的相关性,但究竟前者是后者的原因,还是后者是前者的原因,抑或其中没有显示出来的第三者(比如家庭环境的影响和本人的暴力倾向等)对其两者产生了影响,这些仅仅通过单纯的交叉表统计和p值是无法确定的。
1702627792
1702627793 不过,这只能说通过片面的数据,或者说只进行简单的统计分析,无法确定。如果仔细地选取数据,或者采用更加缜密复杂的分析方法,那么即便无法得到完美的答案,也可以找出原因和结果,甚至能够分析出结果。如果对“原因”进行控制的话,又会出现怎样的“结果”?
1702627794
1702627795 特别值得我们关注的,应该是“仔细地选取数据”的方法。具体来说,就是近年来网络上十分热门的“A/B测试”,同时也是被统计学家们称为“随机对照试验”的方法,让我们围绕着它来进行分析,看看它究竟有多么强大。
1702627796
1702627797 妇人与奶茶:世界上第一次随机对照试验
1702627798
1702627799 之所以在这部分内容中对随机对照试验究竟有多么强大进行说明,最重要的原因是“人类对于任何能够控制的东西,都可以分析其因果关系”。
1702627800
1702627801 假如要证明“超能力是否存在”,那么统计学家们一定很乐于为此提供帮助。如果统计学无法科学地证实超能力的存在,那么理由只有一个,就是超能力在这个世界上根本不存在。
1702627802
1702627803 像占卜师和超能力者之类依靠神秘术为生的人,或者对此深信不疑(甚至被欺骗)的人,总是会说“这个世界上有现代科学无法解释的现象存在”。
1702627804
1702627805 但这根本是无稽之谈!费希尔几乎凭借一己之力创造的被称为随机对照试验的方法,不但改变了科学哲学,甚至使科学能够影响到的领域爆炸性地扩大。虽然有伦理性和可控性等现实的制约,但科学无法解释的东西已经不存在了。
1702627806
1702627807
1702627808
1702627809
1702627810 图4–1 现代统计学之父 罗纳德·艾尔默·费希尔
1702627811
1702627812 费希尔完成于1935年的著作《试验设计》首次创立了随机对照试验的体系,在这本书中提到了一个妇人和奶茶的故事。
1702627813
1702627814 在20世纪20年代末的英国,一个阳光明媚的午后,许多英国绅士与妇人们在室外的餐桌旁享用美味的红茶。这时,有一位妇人说道:“奶茶是先放红茶还是先放牛奶,味道完全不一样,我一下子就能品尝出来。”就连这个看上去只是随口说说的事情,随机对照试验也能够对其进行科学证实。
1702627815
1702627816 在场的大部分绅士都对妇人的说法一笑了之,根据他们学过的科学知识,红茶和牛奶只要混在一起,就没有任何化学性质上的区别。
1702627817
1702627818 但是,只有一位身材矮小,戴着厚厚的眼镜,留着小胡子的男子对妇人的说法很感兴趣,并且提出“那么我们来做个试验”。这名男子正是现代统计学之父——罗纳德·艾尔默·费希尔。
1702627819
1702627820 费希尔迅速地将茶杯摆成一排,在妇人看不到的地方准备了两种冲泡方法不同的奶茶。然后,他让妇人按照随机的顺序品尝奶茶,并且将妇人的回答记录下来,用概率进行了计算。据说,这就是世界上第一次进行的随机对照试验。
1702627821
1702627822 为什么要用这种方法验证妇人的话呢?在回答这个问题之前,让我们先考虑一下如果不用这种方法的话,究竟应该如何判断妇人的话是否正确?
1702627823
1702627824 比如给妇人一杯“先放红茶的奶茶”,就算她的判断是对的,也不能证明她真的有准确的分辨能力。因为妇人完全靠猜也有50%的概率可以猜中,所以不能将其作为判断依据。
1702627825
1702627826 那么,交替给妇人“先放红茶的奶茶”和“先放牛奶的奶茶”,如果妇人每次都说中的话,结果又如何呢?
1702627827
1702627828 虽然这种方法比只有一次的试验稍微强一点,但其准确性仍然很低。因为如果有“交替重复”这种规律存在的话(而且妇人也知道这种规律,或者偶然间发现了规律的话),那么只要偶然猜中第一杯奶茶的结果,那么后面的答案也就全都随之揭晓了。
1702627829
1702627830 当然,先连续给她5杯“先放红茶的奶茶”,再连续给她5杯“先放牛奶的奶茶”的方法也不推荐。因为这样只要第一次偶然猜对,接下来只要猜出“第几杯开始更换”就可以了。而且,之前品尝的“先放红茶的奶茶”肯定比后来“先放牛奶的奶茶”的温度更高,单凭温度进行判断也可以被她偶然猜中。
1702627831
1702627832 那么究竟应该怎样做才好呢?只要将两种奶茶随机交给妇人,然后看她能够猜中几个就好了。这就是随机对照试验的基本思考方法。因为奶茶是随机选择的,而且是在她看不见的地方倒好的,所以根本无法预测顺序。
1702627833
[ 上一页 ]  [ :1.702627784e+09 ]  [ 下一页 ]