1702629850
我的意思并不是叫你不要相信失业率数字。失业率的定义已经使用了好一段时间,在各个国家之间,这个定义也大致吻合,所以我们可以在国家间做比较。失业率是由不受政治干扰的专业人士计算出来的,是重要且有用的信息。我要强调的是,并不是每件重要的事都可以用数字表示。此外把事情简化为数字的人,会受到各种压力的影响,不管有意的还是无意的。
1702629851
1702629852
统计学与你
1702629853
1702629854
这不是一本关于统计工具的书,本书写的是统计学的观点及其对日常生活、公共政策和其他不同研究领域的影响。当然,你将会从本书中学到一些统计工具。如果你手上有一台内置了统计功能的计算器,你的生活将会容易很多,特别是这台计算器可以计算平均值、标准差和相关系数。找一台可以做“双变量统计”或“相关性分析”的计算器,如果你的电脑上有统计软件,就更好了。另一方面,你需要懂一点儿数学。如果你理解并会使用一些简单的方程式,就再好不过了。不过要记住,我们要求你学会思考,思考对于大脑的训练要远胜过数学公式。本书将从4个方面展现统计学思维方式:
1702629855
1702629856
•数据生产讨论了数据产生的方法,可以对特定问题给出解决方案。数据来自何处至关重要,关于如何选择样本和设计实验的基本概念,是统计学中最有影响力的内容。
1702629857
1702629858
•数据分析关注的是收集、组织,以及用图表、数字描述数据的方法和策略。你可以学会使用非常简单的工具聪明地分析数据。
1702629859
1702629860
•概率是我们用来描述机会、变化和风险的语言。由于变化无处不在,概率思维有助于将现实与背景噪声区分开。
1702629861
1702629862
•统计推断是指通过我们手中掌握的数据得出结论,考虑到变化无处不在,结论是不确定的。
1702629863
1702629864
最终数据会被用于得出结论或做出决定。本书的各个部分讨论了影响这一过程各个步骤的质量问题。读者很容易把注意力放在每章的细节上,而忽略了这些细节背后的整体图景。为了帮助你避免这种见树不见林的问题,看清楚每章与整体图景的关系,我们在每章结尾处简短地说明这一章在整体图景中的位置。你可以在每章的小结中看到这部分内容。
1702629865
1702629866
统计思维和工具在人们处理数据的过程中逐步显现。两个世纪前,天文学家和勘测员面对的问题是,即便把许多观察结果非常小心地拼凑起来,仍然发现它们无法很好地吻合。他们努力处理数据的变化,因而产生了最初的一些工具。当社会科学在19世纪出现时,旧的统计思维发生了转变,新思维被发现,用于描述个体和社会的变化。对遗传和生物学总体变量的研究推进了统计学的发展。20世纪前半叶诞生了建立在概率之上的用于生成数据和进行统计推断的统计设计。直到20世纪中期,人们才清楚地看到了一门新学科的诞生。由于所有研究领域都更加注重数据,而且越来越明显地意识到数据变化是无法避免的,统计学已经成为核心知识。每个受过教育的人都应该了解统计推断,阅读本书,能够让你掌握这方面的知识。
1702629867
1702629868
[1]1磅≈0.454千克。—编者注
1702629869
1702629870
[2]1盎司≈28.35克。—编者注
1702629871
1702629872
1702629873
1702629874
1702629876
统计学的世界(第8版) 第1部分 数据的生产
1702629877
1702629878
你和你的朋友不是典型人物。比如,你喜欢听的广播节目可能就和我喜欢的不一样。当然,我和我的朋友也不是典型人物。如果想要知道整个国家(或只是大学生)的状况,我们必须认清一个事实,那就是,整体状况也许和我们自己或我们周围的状况并不相似。所以,我们需要数据。从Arbitron(一家媒体研究机构)得到的资料显示,美国最受欢迎的广播节目是成人当代音乐(2009年秋天,每周的听众总人数达到7200万人)和乡村音乐(每周的听众总人数为6400万人)。如果你喜欢当代流行打击乐(每周的听众总人数为5900万人),而我喜欢各种新闻节目(每周的听众总人数为1500万人),那么我们可能对整个唱片消费群体的音乐品位一无所知。如果我们身处唱片业,或只对通俗文化感兴趣,就必须把自己的喜好放在一边,好好地检视数据。
1702629879
1702629880
你可以到图书馆或者网上找数据,但我们怎么知道这些数据可不可靠呢?好的数据可以被看作像毛衣或数码影音光碟机(DVD机)之类的产品,而草率生产的数据就像草率生产的毛衣或DVD机一样令人沮丧。你买毛衣前一般都会检查一下,如果做工很差,你就不会买。数据也一样,如果质量很糟,你就不该用。本书的第一部分将会告诉你怎样分辨数据的好坏。
1702629881
1702629882
1702629883
1702629884
1702629886
统计学的世界(第8版) 第1章 数据从哪里来
1702629887
1702629888
案例分析
1702629889
1702629890
你可能读了几个月的报纸,或者看了几个月的电视新闻,却没有见过一个代数公式。难怪你会认为代数看上去和日常生活完全无关。但是,你不可能一整天都接触不到统计数据和结果。比如,一则新闻提到在18~24岁年龄段的人中,有70%的人认为从互联网上下载音乐与购买二手音乐光碟或从朋友那里借来转录的做法没有区别。而对于65岁或以上的人来说,持相同观点的人只有36%。一篇更长的文章写道,得到高质量日间看护的低收入家庭的孩子,几年后在学业方面的表现更佳,与其他低收入家庭的孩子相比,未来更有可能考上大学、找到好工作。
1702629891
1702629892
这些数据是从哪里来的呢?为什么我们可以相信这些数据,或者不应该相信这些数据?好的数据是人类智慧劳动的成果,坏的数据则源于懒惰或者不求甚解的行为,只能误导他人。当有人向你抛来一个数字时,你应该问的第一个问题就是:它来自何处?
1702629893
1702629894
2008年美国总统大选期间,有一个全国性的项目叫作“大家去投票”,人们从罐中选择一粒软糖,代表他们支持的总统候选人。在佛罗里达州彭布罗克派恩斯的“咖啡苑”(Coffee Scene),顾客可以在每次买东西时挑选一粒蓝色或者红色的软糖。蓝莓软糖表示投票给民主党总统候选人巴拉克·奥巴马,红色草莓软糖表示投票给共和党总统候选人约翰·麦凯恩。
1702629895
1702629896
全美有34个州的超过100家餐馆参与了这项活动,每周一清点投票结果。截至2008年10月13日,投票总数超过211000张,麦凯恩在这场全国性的软糖投票中获得了53.5%的支持率。2004年美国总统大选期间的软糖投票结果,曾准确预测出小布什将赢得总统大选。约翰·麦凯恩却没有那么幸运,投票结果错误地预测麦凯恩将在2008年的美国总统大选中胜出。
1702629897
1702629898
对于这个投票结果,我们该如何解读呢?在本章的最后,你将了解到,针对这个软糖投票活动产生的数据,如何提出一些基础性问题。对这些提问的回答,将帮助我们评估这个投票数据的优劣,我们将在第2章深入探讨这个问题。
1702629899
[
上一页 ]
[ :1.70262985e+09 ]
[
下一页 ]