打字猴:1.702640005e+09
1702640005
1702640006 在n=1000时,P=0.66;当n=4040时,P=0.37;当n=100000时,P=0.000009。
1702640007
1702640008 想象一下抛一枚硬币1000次的情形,差不多有2/3的时间,你得到的正面朝上的比例与0.5的差距,会像布冯的0.507与0.5的差距那么大。可是,如果你抛硬币100000次,则几乎不会(概率为百万分之九)得到这样的结果。
1702640009
1702640010
1702640011 如果=0.507出现在抛硬币1000次或4040次的情况下,那么它并不是硬币不平衡的证据。但如果它出现在抛硬币100000次的情况下,它就会成为令人信服的证据。
1702640012
1702640013 只报告P值
1702640014
1702640015 显著性检验的P值不仅和样本量密切相关,也和总体参数的真实值有关。若只报告P值,而不报告样本量,也不提作为样本结果的统计量是什么,就是很糟糕的做法。
1702640016
1702640017 练习
1702640018
1702640019 23.1 减肥。一家从事帮助人们减肥业务的公司进行了一项随机实验,以便了解人们参加该公司的减肥项目8周后是否有效果。该公司的实验人员报告说,平均而言,该项研究的实验对象体重有所下降,且P值为0.013。你觉得这个结果有说服力吗?如果有,为什么?如果没有,你还需要知道哪些信息?
1702640020
1702640021 置信区间的优点
1702640022
1702640023
1702640024
1702640025 例2和例3告诉我们,要评估一项统计研究的结果,不能只看它是否具有统计学显著性。在例3中,光是知道样本比例=0.507就很有用了,你可以自己判断这个值与0.5的距离,是否大到令你感兴趣。当然,=0.507并不是硬币正面朝上的真实概率,而只是布冯伯爵抛硬币的结果。所以,置信区间更有用,因为它的宽度可以帮助我们把正面朝上的真实概率定位得更精确。以下是正面朝上的真实概率p的95%置信区间,分别对应例3中的三个规模的样本,你可以验证一下。
1702640026
1702640027
1702640028
1702640029
1702640030 置信区间把我们对真实p值的了解(以95%的置信度)明白地表示出来。抛1000次和抛4040次硬币所得到的置信区间都包含了0.5这个数字,所以我们不会怀疑硬币不平衡。可是抛100000次的时候,我们却有把握认为真实的p值落在0.504~0.510的区间里。因此,我们可以认为p值不是0.5。
1702640031
1702640032 给出置信区间
1702640033
1702640034 置信区间提供的信息比显著性检验多,因为置信区间实际上估计了总体参数的值,而且置信区间也比较容易解释。因此,好的做法是尽可能地给出置信区间。
1702640035
1702640036 “5%的显著性水平”并非神奇的指标
1702640037
1702640038 显著性检验的目的,就是评估样本所提供的不利于零假设的证据有多强,P值在做这件事。但是,要证明零假设不正确,P值要小到何种程度,才能令人信服呢?这主要根据两种情况来决定:
1702640039
1702640040 • H0的可信度有多高?如果H0所代表的假设是人们多年来一直深信不疑的事,就需要很强的证据(很小的P值)才能说服他们。
1702640041
1702640042 • 否定H0的结果是什么?如果否定H0而肯定Ha,意味着要花很多钱把产品包装改换成另一种,你就需要有很强的证据,证明采用新包装一定能增加销售量。
1702640043
1702640044 这两种标准都有点儿主观。不同的人常想用不同的显著性水平,P值可以让我们自行决定证据是不是充分。但什么样的显著性水平能让我们满意,必须在计算P值之前就确定下来。先计算P值,再确定让我们满意的显著性水平略高于这个P值,这种做法是对显著性检验的滥用。
1702640045
1702640046 使用统计检验的人常会强调某几个标准的显著性水平,比如10%、5%和1%。举例来说,法庭在一些歧视案件里常用5%当作标准。把重点放在这几个值上,反映出做统计检验的人仍在使用临界值,而尚未进入电脑时代。5%的显著性水平(α=0.05)尤其常见。在“显著”和“不显著”之间没有清楚的界线,只是在P值越来越小时,我们有越来越强的证据而已。0.049和0.051这两个P值,并没有实质性差别。把P≤0.05当作“显著性水平”的全球性标准,一点儿道理也没有。
1702640047
1702640048 【统计学中的争议】 应该禁止显著性检验吗?
1702640049
1702640050 许多领域的研究都依赖显著性检验,甚至形成过度依赖。哈佛大学一位因统计检验而出名的杰出心理学家罗伯特·罗森塔尔说:“我们当中许多人所受的训练,是叫我们不要过于仔细地看数据。你建立一项假设,选择用何种统计检验方法,然后执行该检验,如果你的结果有5%的统计学显著性水平,你的假设就会得到支持。否则就把它们往抽屉里一塞,束之高阁。”
1702640051
1702640052 你对上面的说法有何反应?这个方法与我们在本书里强调的方法相比,怎么样?
1702640053
1702640054
[ 上一页 ]  [ :1.702640005e+09 ]  [ 下一页 ]