1702629835
1702629836
该报告事实上说的是,“乳腺X线检查可以将乳腺癌死亡率减少26%(置信度为95%,置信区间为17%~34%)”。而根据尼尔森的观点,26%这个数字是“某个范围的简化说法,这个范围描述了我们对现时情况的实际了解程度”。在这个案例当中,这个范围是17%~34%,而且我们对它有95%的把握。也就是说,我们相当有把握,但不是百分之百确定。当你阅读新闻报道时,可以找找看有没有诸如“95%的置信度”或“有统计学显著性”等字眼,如果有,就代表这个研究结果虽不能说百分之百确定,但有很大的把握。
1702629837
1702629838
数据可反映社会价值
1702629839
1702629840
要用统计数据骗人很容易。但如果不用统计数据,骗人就更容易了。
1702629841
1702629842
弗里德里克·莫斯特勒
1702629843
1702629844
好的数据确实胜过逸闻。比起逸闻和大声争论未来会发生什么,数据要客观得多。和其他的公开论述相比,统计数据建立在事实的基础上,而且比较科学和理性。对于存在争议的话题,统计数据应该比其他大部分证据受到更多的重视。不过,世界上没有百分之百客观这回事。社会环境会影响我们关于度量什么以及如何度量的决策,从而影响到统计数据。
1702629845
1702629846
以自杀率为例,它在不同国家之间有很大的差别。各国公布的自杀率之所以存在差别,似乎大部分要归因于社会观念,而不是因为自杀率真的有差别。自杀人数是根据死亡证明书计算的。填写死亡证明书(证明书上的细节在不同的国家或不同的州之间有所不同)的官员,对于诸如没有目击证人的溺死或摔死事件,可以决定其是否算作自杀。在视自杀为耻辱的地方,就有较多的自杀被报告为意外死亡。比如,在大部分人信奉天主教的国家,其公布的自杀率就比其他国家低。在日本文化中,有遇到羞辱时就光荣自杀的传统,这种传统使人们不太将自杀视为耻辱,因此日本的自杀事件被报道的比例较高。在有些国家,因为社会价值观的改变,使得自杀事件的数量在增加。一个越来越普遍的看法是,抑郁症应该被视为生理上的疾病,而不是人性的弱点,自杀是这种疾病的悲剧性结局,而不是道德瑕疵。因此,死者家属和医生愿意把自杀列为死者的死因。
1702629847
1702629848
在不像自杀那么敏感的问题上,社会价值观依然可能会影响统计数据。美国的失业率是每个月由美国劳工部劳工统计局用一个很大而且很专业的全国性样本计算出来的。但是,“失业”的定义是什么呢?它指的是,虽然你想工作却没有工作,而且过去两周在积极找工作。如果你过去两周没在找工作,你就不算失业人员,而只是“非劳动人口”。这样去定义失业率,反映了我们加诸工作的价值观。如果换一种定义,我们可能就会得到不一样的失业率数字。
1702629849
1702629850
我的意思并不是叫你不要相信失业率数字。失业率的定义已经使用了好一段时间,在各个国家之间,这个定义也大致吻合,所以我们可以在国家间做比较。失业率是由不受政治干扰的专业人士计算出来的,是重要且有用的信息。我要强调的是,并不是每件重要的事都可以用数字表示。此外把事情简化为数字的人,会受到各种压力的影响,不管有意的还是无意的。
1702629851
1702629852
统计学与你
1702629853
1702629854
这不是一本关于统计工具的书,本书写的是统计学的观点及其对日常生活、公共政策和其他不同研究领域的影响。当然,你将会从本书中学到一些统计工具。如果你手上有一台内置了统计功能的计算器,你的生活将会容易很多,特别是这台计算器可以计算平均值、标准差和相关系数。找一台可以做“双变量统计”或“相关性分析”的计算器,如果你的电脑上有统计软件,就更好了。另一方面,你需要懂一点儿数学。如果你理解并会使用一些简单的方程式,就再好不过了。不过要记住,我们要求你学会思考,思考对于大脑的训练要远胜过数学公式。本书将从4个方面展现统计学思维方式:
1702629855
1702629856
•数据生产讨论了数据产生的方法,可以对特定问题给出解决方案。数据来自何处至关重要,关于如何选择样本和设计实验的基本概念,是统计学中最有影响力的内容。
1702629857
1702629858
•数据分析关注的是收集、组织,以及用图表、数字描述数据的方法和策略。你可以学会使用非常简单的工具聪明地分析数据。
1702629859
1702629860
•概率是我们用来描述机会、变化和风险的语言。由于变化无处不在,概率思维有助于将现实与背景噪声区分开。
1702629861
1702629862
•统计推断是指通过我们手中掌握的数据得出结论,考虑到变化无处不在,结论是不确定的。
1702629863
1702629864
最终数据会被用于得出结论或做出决定。本书的各个部分讨论了影响这一过程各个步骤的质量问题。读者很容易把注意力放在每章的细节上,而忽略了这些细节背后的整体图景。为了帮助你避免这种见树不见林的问题,看清楚每章与整体图景的关系,我们在每章结尾处简短地说明这一章在整体图景中的位置。你可以在每章的小结中看到这部分内容。
1702629865
1702629866
统计思维和工具在人们处理数据的过程中逐步显现。两个世纪前,天文学家和勘测员面对的问题是,即便把许多观察结果非常小心地拼凑起来,仍然发现它们无法很好地吻合。他们努力处理数据的变化,因而产生了最初的一些工具。当社会科学在19世纪出现时,旧的统计思维发生了转变,新思维被发现,用于描述个体和社会的变化。对遗传和生物学总体变量的研究推进了统计学的发展。20世纪前半叶诞生了建立在概率之上的用于生成数据和进行统计推断的统计设计。直到20世纪中期,人们才清楚地看到了一门新学科的诞生。由于所有研究领域都更加注重数据,而且越来越明显地意识到数据变化是无法避免的,统计学已经成为核心知识。每个受过教育的人都应该了解统计推断,阅读本书,能够让你掌握这方面的知识。
1702629867
1702629868
[1]1磅≈0.454千克。—编者注
1702629869
1702629870
[2]1盎司≈28.35克。—编者注
1702629871
1702629872
1702629873
1702629874
1702629876
统计学的世界(第8版) 第1部分 数据的生产
1702629877
1702629878
你和你的朋友不是典型人物。比如,你喜欢听的广播节目可能就和我喜欢的不一样。当然,我和我的朋友也不是典型人物。如果想要知道整个国家(或只是大学生)的状况,我们必须认清一个事实,那就是,整体状况也许和我们自己或我们周围的状况并不相似。所以,我们需要数据。从Arbitron(一家媒体研究机构)得到的资料显示,美国最受欢迎的广播节目是成人当代音乐(2009年秋天,每周的听众总人数达到7200万人)和乡村音乐(每周的听众总人数为6400万人)。如果你喜欢当代流行打击乐(每周的听众总人数为5900万人),而我喜欢各种新闻节目(每周的听众总人数为1500万人),那么我们可能对整个唱片消费群体的音乐品位一无所知。如果我们身处唱片业,或只对通俗文化感兴趣,就必须把自己的喜好放在一边,好好地检视数据。
1702629879
1702629880
你可以到图书馆或者网上找数据,但我们怎么知道这些数据可不可靠呢?好的数据可以被看作像毛衣或数码影音光碟机(DVD机)之类的产品,而草率生产的数据就像草率生产的毛衣或DVD机一样令人沮丧。你买毛衣前一般都会检查一下,如果做工很差,你就不会买。数据也一样,如果质量很糟,你就不该用。本书的第一部分将会告诉你怎样分辨数据的好坏。
1702629881
1702629882
1702629883
1702629884
[
上一页 ]
[ :1.702629835e+09 ]
[
下一页 ]