打字猴:1.70262788e+09
1702627880 看穿一切数字的统计学 [:1702626744]
1702627881 15 随机对照试验:商业竞争中的有力武器
1702627882
1702627883
1702627884
1702627885 用随机对照试验找出表象背后的真相
1702627886
1702627887 之所以说统计学是“最强的学问”,是因为其拥有较高的适用性,也就是说不管在政治、教育、商业还是体育等领域,统计学都能够以最快的速度帮助我们找到最佳答案,关于这一点我已经在前面的章节中提到过了。而前文内容中介绍的能够对任何因果关系进行科学验证的“随机对照试验”,则刚好为统计学的适用性提供了强大的理论依据。
1702627888
1702627889 甚至可以说,费希尔创立的随机对照试验这一方法论,彻底地改变了科学领域所能涵盖的范围。
1702627890
1702627891 什么是科学?如果要详细回答这个问题的话,那么本书的内容就不是讲统计学,而是变成讲科学了。有关科学的详细内容,诸位读者有兴趣的话可以去找相关图书阅读,在这里我要介绍的是科学方法论的重要特征——“观察与试验”。“观察”就是对目标进行详细的观看和测量,并且从中找出真相的行为。“试验”则是在改变各类条件的前提下对目标进行观察的行为。
1702627892
1702627893 不管是观察还是试验,毫无疑问,统计学都在其中发挥了非常重要的作用,但随机对照试验这一形式,则使“试验”的思维方式向前迈进了一大步。
1702627894
1702627895 当然,在费希尔之前也有许多十分巧妙的试验。比如说在医学领域,1628年威廉·哈维通过将动物身体各个部位的血管进行绑扎试验,证明了血液是由心脏流经全身各个部位并在全身循环的事实。而在此之前,人们普遍认为血液是由肝脏产生并在人体各个部位消耗掉的。
1702627896
1702627897 除了哈维之外,在化学和物理学领域也有许多通过巧妙的试验才得以证实的定理和公式。但是,如果没有费希尔的随机对照试验,人类就无法科学地掌握“存在误差的现象”。
1702627898
1702627899 将血管捆扎之后,血流量就会减少,想必这一现象连小学生都知道。因为在这个现象中没有误差存在。牛顿看到苹果落地的现象后发现万有引力定律,而将苹果在空中放手后,每次苹果都会加速落地。
1702627900
1702627901 生物学领域又如何呢?我们可以对生物进行观察,实际上到中学为止,所学的生物学基本上都是对各种生物进行观察,理解其特征并且对其进行分类的博物学。就连在生物学上最具革命性的达尔文进化论,其研究方法也没有脱离博物学的生物学范畴。
1702627902
1702627903 但是,当我们理解了这些科学的方法论特征之后,对于“如何增加小麦的产量”这一课题,应该如何运用科学的方法来进行证明呢?
1702627904
1702627905 相比生物学家而言,农民对小麦的特征和种类应该更加清楚,而且他们根据自己的种植经验,或许会有“排水不畅的话收成就不好”、“冬天阳光充足的话就会大丰收”之类的建议。为了增加产量,应该在什么时候,加入多少、什么种类的肥料,他们对这一点应该也有自己的经验和直觉。
1702627906
1702627907 但是,他们的这种经验在费希尔之前都是不科学的。为什么这么说,因为这种经验并不像苹果每次都会加速落地。仔细施肥小心照料的年份,和几乎不施肥粗心照料的年份相比,有时候后者可能因为气候等原因反倒收成更好。而且,就算是在同一年份,施加同样肥料的田地里,也有茁壮生长的小麦和长势不好的小麦这样的个体差异。“利用试验找出真相”的科学方法论,在费希尔之前的时代是没有人想到过的。
1702627908
1702627909 找到“误差”的3种方法
1702627910
1702627911 当某种现象不会百分之百地出现时,要想科学地掌握这种现象,有3种方法。
1702627912
1702627913 第一种,是完全不考虑实际数据,以假设为依据建立理论模型。在统计学诞生之前,经济学等社会科学经常采用这种方法。
1702627914
1702627915 第二种,为了证明“百分之百出现”的状态,只将出现的结果进行报告。
1702627916
1702627917 比如,出现在生物教科书上的孟德尔,在针对豌豆的遗传因素进行调查的试验报告中就利用了这一方法,他在初期的试验报告中声称“以10次试验结果为例”,但实际上他选择的都是与他主张的遗传因素完全匹配的豌豆数据。当然除了这次试验之外,孟德尔还进行了许多次试验,并且提供了更多的数据,后来费希尔根据他所提出的报告进行了综合验证,得出“与实际相比,明显有少量误差”的结论。也就是说,不管是孟德尔还是他的助手都可能造成了失误,在孟德尔的报告中,只选择了与自己的主张匹配的“完美结果”。当然即便如此,他的遗传理论本身也是正确的。
1702627918
1702627919 至于第三种,就是费希尔提出的将随机因果关系用概率的形式表现出来的方法。
1702627920
1702627921 之前之所以列举小麦的例子,就是因为这是费希尔在“奶茶事件”之外第一次应用随机对照试验的事例。费希尔虽然拥有天才的头脑,但是却因为性格倔强而得罪了不少人,终于他厌倦了大学里的学术斗争,20~40岁这段时间他都是在英国的洛桑实验室以一名研究员的身份度过的。
1702627922
1702627923 他在因为学术斗争而意志消沉的这段时间,却有了改变历史的重大发现,可见人生真是难以预料。像费希尔这样的天才想要有所发现,既不需要气派的办公室,也不需要毫无实用价值的头衔,不需要优秀的同事,也不需要充足的研究经费,他所需要的只是能够自由使用的时间和数据。
1702627924
1702627925 想要对肥料A和肥料B与小麦产量之间的关系进行科学分析的话,试验结果确实很容易受排水、土壤肥沃程度、日照等客观条件的影响。但是,如果将耕地分为许多单位,随机将肥料撒在耕地上,那么施加肥料A的土地分组和施加肥料B的土地分组之间,平均条件就会大致相同。
1702627926
1702627927 随机化和随机样本这两个词语比较容易混淆,希望大家注意,但是通过随机确实能够对推测结果的误差进行控制,这一点是两者共有的特征。假设将全部耕地分为40个区域,在数量各占一半的区域分别随机施加肥料A和肥料B,其中一组的大部分区域集中在日照充足区域的概率有多少呢?
1702627928
1702627929 如果各个区域日照充足的概率全都是50%,那么随机施加肥料A的区域全部集中在日照充足区域的概率就是1/2的20次方,即大约1/1 000 000的概率。而两组中日照充足区域大致相同的概率则为13%(日照充足区域的数量差在1个以内的概率为36%,两个以内的概率为57%)。至于排水和土壤肥沃程度等条件也和日照的情况一样。
[ 上一页 ]  [ :1.70262788e+09 ]  [ 下一页 ]