打字猴:1.701778418e+09
1701778418
1701778419 一些“前后对比”实验只是在偶然的情况下产生的,其结果虽然意外但很有用。我最喜欢的这样一个例子是在美国西南部的一家礼品店里发生的。绿松石类的珠宝销量很差,因此当店主要做一次短途旅行的前夜,他打算将这类珠宝降价出售,他留给店员一块标牌,上面写着“所有绿松石类珠宝价格乘以1/2”。当店主返回的时候,几乎所有此类珠宝都售完了。而店主在听店员提起另一件事时,震惊之余,更是无比开心。店员表示,较之放那块牌子前,珠宝在以正常价格的两倍出售时销量好得惊人。原来,这位店员误解了店主的意思,他以为要加价一倍售卖,而不是以半价出售。
1701778420
1701778421 通常情况下,价格比较公平地代表了商品的价值,因此消费者会以高价购买相应价值的珠宝。当然,这种状况并不适用于所有类别的商品,然而绿松石类的珠宝绝对是会让消费者倚赖其价格为判断依据的一种商品,因为很少有人具有判定其价值的专业知识。
1701778422
1701778423 “前后对比”设计的效力意味着我们可以在自己身上进行真实的实验。你偶尔会因胃酸过多而消化不良,但是不知道确切原因,该怎么办呢?你可以每天记录自己的饮食日志,尤其注意那些可能的“罪犯”——酒、咖啡、苏打水、巧克力。然后进行一次真正的随机实验——掷一次硬币来决定是否喝一杯鸡尾酒。每次只变化一种东西,以避免出现混杂变量。如果你不吃巧克力,也不喝苏打水,你的胃回流状况改善,那么你将不知道究竟是食物还是饮品充当了“罪犯”。在围绕“口头报告”而展开的第12章中,除了考虑一些科学方法论之外,还提供了大量建议帮助你自己做实验。
1701778424
1701778425 统计相关性与统计独立性
1701778426
1701778427 更多的样本量,随机布置的实验条件,这些都增加了我们对某一效果是真实的信心。然而,还有另一个因素也很重要,这便是我们认为什么样的样本才算数。假设你在一个有30个学生的班级1中实验A程序。A程序是标准的教学方式——课上讲授,课下做作业。你在另一个有25个学生的班级2中实验B程序——在家通过视频听课、完成作业。那么样本总量是多少?肯定了,不是55,如果对比的数据存在差额,那么能表现出显著性差异的样本到底是多少呢?
1701778428
1701778429 样本量是2。这是因为只有当存在独立观察时,样本量才等于搜集的案例个数。然而,就这种针对一个班的学生或任何群体的实验来说,群体中的个体之间在采取实验措施和最后进行测量之时都会产生互动,这样每个个体的行为就不是独立产生的了。琼的疑惑可能让其他人感到慌乱,比利的古怪行为可能拉低测验中每个人的得分。每个个体的行为都会潜移默化地受其他人的行为影响。在这种情况下,无法得出具有显著统计学意义的测量结果,除非群体的数量特别巨大,在此处样本数量指的是群体的数量,而非群体中个体的数量。
1701778430
1701778431 如果你无法进行具有统计学意义的测验,那么毫无疑问你无法确切知道不同方式对某件事情产生的效果。然而,在第二次实验的时候采取第一次效果较好的方式是种更聪明的选择,这比你单纯依靠自己的假想要好。
1701778432
1701778433 独立性的概念对于理解事件是具有无限可能性这一点至关重要。比如在2008年,发生了一件令人惊讶的事,进行金融评级服务的标准普尔公司应用了可能出现违约状况的房屋抵押贷款模型,在这类模型中,假设违约状况是独立于其他因素而存在的。乔·道克斯在迪比克市的违约行为被认为与简·道伊在丹佛市的违约行为毫无关联。这些在日常生活中的状况并非毫无道理可言。然而,在各类情况层出不穷的大千世界,即便在一个房价似乎稳定增长的时期,你还是要预想到可能会遇到经济泡沫。因此,针对20031A型房屋抵押贷款的违约行为在统计学意义上可能会依赖于人们在90014C型房屋抵押贷款上是否出现违约行为。
1701778434
1701778435 评级机构从来都不是中立的。银行会向它们支付服务费用。越容易给出安全性高评级的评级机构越受欢迎。因此,评级机构是否会以拙劣之计创制出违约模型,或是有一些欺骗性行为,我实在不好做出评价。不过,有一点是我们都应当明白的:有缺陷的科学方法论会导致灾难性的后果。
1701778436
1701778437 小结
1701778438
1701778439 单纯的假想很有可能是错误的。即使它们是正确的,在你有条件进行测试的时候还依靠它们也是愚蠢的。“A或B”测试在原理上十分简单:设计一种你想检测的步骤,设置一个对照情况,掷一枚硬币以决定谁(或者什么)采取何种方式,然后看看会发生什么。借由随机设计发现的差异表明,自变量的改变会对因变量产生因果式的影响。而借由相关性的方法发现的差异则不能保证自变量对因变量产生确定的影响。
1701778440
1701778441 相关性设计之所以不可靠,是因为研究者没有限定样本的具体条件。例如,对比大量和少量家庭作业,广播广告和传单广告,高收入和低收入。如果你没有根据一定的条件随机搜集样本——无论是人、动物还是农田,那么你就给自己的分析增添了各种不确定性。在某一个层面上的自变量样本可能和在其他层面上的自变量差异极大,而且差异体现的方式也有许多种,其中有些差异可以辨认出来,而另一些并不能。有时候并不是相关的自变量引发了不同,而是任何一种可测量的变量,或是不可测量乃至不可构想出的变量,产生了一些效果。此外,有时候实际上可能是我们认定的因变量反而扮演了自变量的角色。
1701778442
1701778443 样本的数量越大——人、农田或是其他事物,那么你发现真正起作用的因素的可能性就越大,同时你误将一些虚假因素当作真实因素的可能性就越小。如果通过某种统计检验而发现差异的发生概率小于在20个随机样本中发生一次,则显著性水平表示为0.05。如果不做这样的测试,我们便无法知晓一种效应是否应当被看作真实。
1701778444
1701778445 当你在分配样本时考虑了所有可能性,那么你的设计便是高度可信的。这是说,在反映某一个维度上的差异时,“内设计”比“对比设计”更具有统计学意义上的显著性。这是因为在任意两个样本之间的所有可能差异都被控制了,只剩下分配样本这一项上的差异,而它可能是事物产生关联的原因。
1701778446
1701778447 辨别你所检验的样本(比如由人去做关于人们行为或心理的研究)之间是否相互影响十分重要。任何时候,当某个样本可能会影响其他样本时,就会缺乏统计上的独立性。某种事物的样本量(N)并不会影响另一种事物的样本量。A班代表的样本量为N,这里的N指的并不是这一个班里的学生人数,而仅仅是1,A班整体是一个样本。(有一种情况除外,即那种相互影响的状况几乎可以忽略不计或者不存在时,比如学生们在一个带有小隔间的房间中参加考试,他们无法交谈。)
1701778448
1701778449
1701778450
1701778451
1701778452 逻辑思维:拥有智慧思考的工具 [:1701776753]
1701778453 逻辑思维:拥有智慧思考的工具 第10章 自然实验与恰当实验
1701778454
1701778455 因为新生儿的身体免疫系统还未发育成熟,所以需要采取一切措施使其尽量少接触到细菌和病毒,以避免引发疾病。
1701778456
1701778457 ——“健康婴儿抗菌建议”,美国有线电视新闻,2011年2月2日
1701778458
1701778459 在成长早期接触到的细菌种类越多的婴幼儿,在长大后出现各种过敏症状的概率越小。
1701778460
1701778461 ——“婴幼儿接触病菌与低过敏风险的关联”,加拿大电视新闻,2011年11月3日
1701778462
1701778463 我们每天都会被朋友、同事和媒体提供的各种信息淹没,他们竭力向我们建议,应当如何生活以及如何进行专业活动。
1701778464
1701778465 在过去10年中,我们了解到应当在饮食中尽量减少摄取脂肪,而现在我们却得知适量的脂肪是对人体有益的。去年的报道说老年人补充维生素B6可以改善情绪和提升认知功能,而今年的消息否定了维生素B6的这两种功效。15年前,权威人士说每天喝一杯红酒有益于心血管健康,8年前的研究说所有的酒类都有此功能,而上个星期人们又说只有红酒有效了。
1701778466
1701778467 即便我们有意默认相信最新的医学建议,我们还是得思量不同建议之间的矛盾之处。詹妮弗表姐的牙医建议每天使用两次牙线来清洁牙齿,而你自己的牙医则建议偶尔使用牙线就足够了。
[ 上一页 ]  [ :1.701778418e+09 ]  [ 下一页 ]