打字猴:1.702629885e+09
1702629885 统计学的世界(第8版) [:1702629671]
1702629886 统计学的世界(第8版) 第1章 数据从哪里来
1702629887
1702629888 案例分析
1702629889
1702629890 你可能读了几个月的报纸,或者看了几个月的电视新闻,却没有见过一个代数公式。难怪你会认为代数看上去和日常生活完全无关。但是,你不可能一整天都接触不到统计数据和结果。比如,一则新闻提到在18~24岁年龄段的人中,有70%的人认为从互联网上下载音乐与购买二手音乐光碟或从朋友那里借来转录的做法没有区别。而对于65岁或以上的人来说,持相同观点的人只有36%。一篇更长的文章写道,得到高质量日间看护的低收入家庭的孩子,几年后在学业方面的表现更佳,与其他低收入家庭的孩子相比,未来更有可能考上大学、找到好工作。
1702629891
1702629892 这些数据是从哪里来的呢?为什么我们可以相信这些数据,或者不应该相信这些数据?好的数据是人类智慧劳动的成果,坏的数据则源于懒惰或者不求甚解的行为,只能误导他人。当有人向你抛来一个数字时,你应该问的第一个问题就是:它来自何处?
1702629893
1702629894 2008年美国总统大选期间,有一个全国性的项目叫作“大家去投票”,人们从罐中选择一粒软糖,代表他们支持的总统候选人。在佛罗里达州彭布罗克派恩斯的“咖啡苑”(Coffee Scene),顾客可以在每次买东西时挑选一粒蓝色或者红色的软糖。蓝莓软糖表示投票给民主党总统候选人巴拉克·奥巴马,红色草莓软糖表示投票给共和党总统候选人约翰·麦凯恩。
1702629895
1702629896 全美有34个州的超过100家餐馆参与了这项活动,每周一清点投票结果。截至2008年10月13日,投票总数超过211000张,麦凯恩在这场全国性的软糖投票中获得了53.5%的支持率。2004年美国总统大选期间的软糖投票结果,曾准确预测出小布什将赢得总统大选。约翰·麦凯恩却没有那么幸运,投票结果错误地预测麦凯恩将在2008年的美国总统大选中胜出。
1702629897
1702629898 对于这个投票结果,我们该如何解读呢?在本章的最后,你将了解到,针对这个软糖投票活动产生的数据,如何提出一些基础性问题。对这些提问的回答,将帮助我们评估这个投票数据的优劣,我们将在第2章深入探讨这个问题。
1702629899
1702629900 个体和变量
1702629901
1702629902 统计学是关于数据的科学。我们甚至可以说它是“数据的艺术”,因为只有通过正确的判断乃至好的品位和扎实的数学知识,才能得出好的统计数据。好的判断中的一大部分取决于你应该度量什么,以使得出的数据有助于解释你所关心的问题。我们先从一些与数据相关的基本术语入手。
1702629903
1702629904 个体与变量
1702629905
1702629906 个体是一组数据所描述的对象。个体可以是一群人,也可以是一些动物或者其他物品。变量指的是某一个体的特征,不同个体的变量可以取不同的值。
1702629907
1702629908 举个例子,这是统计学课程结束时,教授手中的成绩数据库中的头几行:
1702629909
1702629910
1702629911
1702629912
1702629913 在这里,个体指的是选修这门课程的学生。除了学生的姓名之外,还有三个变量。第一个变量是这名学生的专业,第二个变量是该名学生所得的分数(总分为500分),第三个变量是该名学生的成绩等级。
1702629914
1702629915 尽管统计学是和数字打交道,但并非所有的变量都要用数字表示。有些变量代表的是“类别”,只需将个体归入不同的组别或种类即可。在这个例子的三个变量中,只有总分数是用数值表示的,专业和等级都是类别变量。统计类别变量时,我们采用的是计数或者百分比的方式。例如,我们可以给出得到等级A的学生的百分比,或者给出主修心理学的学生的百分比。
1702629916
1702629917 选择变量时的错误判断,可能导致在数据上浪费大量时间和金钱却徒劳无功。怎样才能做出好的判断,这可能是个富有争议性的问题。下面的例子展示了在判断应该收集哪些数据时面临的挑战。
1702629918
1702629919 例1 谁在做资源回收?
1702629920
1702629921 是谁不嫌麻烦地在做资源回收呢?在加利福尼亚州某个城市的两个社区,暂且命名为“上流社区”和“中低社区”,实验人员花费了大量的时间和金钱,将住户拿到屋外的垃圾过磅称重。因为垃圾和回收物的数量是按照住户而不是人头计算,在这里,个体就是两个社区的所有住户,变量是每周路边回收箱里垃圾的重量。
1702629922
1702629923 “上流社区”每周平均的垃圾重量要比“中低社区”大,我们是否可以据此说富人更严肃地对待垃圾回收这件事呢?不能。有人注意到,“上流社区”的垃圾桶里有很多沉重的玻璃酒瓶。而在“中低社区”,人们扔进垃圾箱的多是轻质塑料汽水瓶和啤酒铝罐。结论是,重量很难告诉我们人们履行资源回收承诺的实际情况。
1702629924
1702629925 例2 你是哪个种族?
1702629926
1702629927 全美人口普查时调查人员会问“你属于哪个种族”,每个家庭成员都要回答这一问题。“种族”是一个变量,美国人口普查局必须给出种族的准确定义。普查表格上列出了一个种族名单,多年来美国政治能够顺顺当当不出问题,主要归功于这个名单。
1702629928
1702629929 名单上应该列出多少个种族?用什么名称来代表它们?需要把混合种族列为一个独立的类别吗?亚裔人想要划分出更多的种族,比如菲律宾人和越南人,因为亚裔人口一直在增长。太平洋岛国的人希望与其他较大的亚洲族群分开。黑人领袖不希望出现混合种族类别,因为担心太多的黑人选择这个类别,将减少黑人人口的官方统计数量。
1702629930
1702629931 2010年的普查表(图1–1)最终列出了6个亚洲族群(加上“其他亚裔人”)和3个太平洋岛国族群(加上“其他太平洋岛国人”),表上没有出现混合种族一项,但人们可以选择多个选项。也就是说,填报混合种族的人可能会被计入多个族群,因此这个数据会比总人口大。因为无法确定如何称呼黑色人种,人口普查局用了“黑色皮肤,非裔美国人或黑人”这一说法。拉丁裔呢?这是另外一个问题,因为他们可能属于任何一个种族,而且无法找到一个能让所有人都满意的说法来代表他们。因此,只能问人们是否属于“西班牙裔、拉丁裔或祖先来自西班牙”。
1702629932
1702629933 在种族问题上存在的争执提醒我们,数据反映了社会。种族是一个社会概念,而不是一个生物学事实。在普查中,你可以决定自己属于哪个种族。种族在美国是一个敏感问题,出现争执也不足为奇。人口普查局的方法似乎是一种不错的折中之策。
1702629934
[ 上一页 ]  [ :1.702629885e+09 ]  [ 下一页 ]