1702629900
个体和变量
1702629901
1702629902
统计学是关于数据的科学。我们甚至可以说它是“数据的艺术”,因为只有通过正确的判断乃至好的品位和扎实的数学知识,才能得出好的统计数据。好的判断中的一大部分取决于你应该度量什么,以使得出的数据有助于解释你所关心的问题。我们先从一些与数据相关的基本术语入手。
1702629903
1702629904
个体与变量
1702629905
1702629906
个体是一组数据所描述的对象。个体可以是一群人,也可以是一些动物或者其他物品。变量指的是某一个体的特征,不同个体的变量可以取不同的值。
1702629907
1702629908
举个例子,这是统计学课程结束时,教授手中的成绩数据库中的头几行:
1702629909
1702629910
1702629911
1702629912
1702629913
在这里,个体指的是选修这门课程的学生。除了学生的姓名之外,还有三个变量。第一个变量是这名学生的专业,第二个变量是该名学生所得的分数(总分为500分),第三个变量是该名学生的成绩等级。
1702629914
1702629915
尽管统计学是和数字打交道,但并非所有的变量都要用数字表示。有些变量代表的是“类别”,只需将个体归入不同的组别或种类即可。在这个例子的三个变量中,只有总分数是用数值表示的,专业和等级都是类别变量。统计类别变量时,我们采用的是计数或者百分比的方式。例如,我们可以给出得到等级A的学生的百分比,或者给出主修心理学的学生的百分比。
1702629916
1702629917
选择变量时的错误判断,可能导致在数据上浪费大量时间和金钱却徒劳无功。怎样才能做出好的判断,这可能是个富有争议性的问题。下面的例子展示了在判断应该收集哪些数据时面临的挑战。
1702629918
1702629919
例1 谁在做资源回收?
1702629920
1702629921
是谁不嫌麻烦地在做资源回收呢?在加利福尼亚州某个城市的两个社区,暂且命名为“上流社区”和“中低社区”,实验人员花费了大量的时间和金钱,将住户拿到屋外的垃圾过磅称重。因为垃圾和回收物的数量是按照住户而不是人头计算,在这里,个体就是两个社区的所有住户,变量是每周路边回收箱里垃圾的重量。
1702629922
1702629923
“上流社区”每周平均的垃圾重量要比“中低社区”大,我们是否可以据此说富人更严肃地对待垃圾回收这件事呢?不能。有人注意到,“上流社区”的垃圾桶里有很多沉重的玻璃酒瓶。而在“中低社区”,人们扔进垃圾箱的多是轻质塑料汽水瓶和啤酒铝罐。结论是,重量很难告诉我们人们履行资源回收承诺的实际情况。
1702629924
1702629925
例2 你是哪个种族?
1702629926
1702629927
全美人口普查时调查人员会问“你属于哪个种族”,每个家庭成员都要回答这一问题。“种族”是一个变量,美国人口普查局必须给出种族的准确定义。普查表格上列出了一个种族名单,多年来美国政治能够顺顺当当不出问题,主要归功于这个名单。
1702629928
1702629929
名单上应该列出多少个种族?用什么名称来代表它们?需要把混合种族列为一个独立的类别吗?亚裔人想要划分出更多的种族,比如菲律宾人和越南人,因为亚裔人口一直在增长。太平洋岛国的人希望与其他较大的亚洲族群分开。黑人领袖不希望出现混合种族类别,因为担心太多的黑人选择这个类别,将减少黑人人口的官方统计数量。
1702629930
1702629931
2010年的普查表(图1–1)最终列出了6个亚洲族群(加上“其他亚裔人”)和3个太平洋岛国族群(加上“其他太平洋岛国人”),表上没有出现混合种族一项,但人们可以选择多个选项。也就是说,填报混合种族的人可能会被计入多个族群,因此这个数据会比总人口大。因为无法确定如何称呼黑色人种,人口普查局用了“黑色皮肤,非裔美国人或黑人”这一说法。拉丁裔呢?这是另外一个问题,因为他们可能属于任何一个种族,而且无法找到一个能让所有人都满意的说法来代表他们。因此,只能问人们是否属于“西班牙裔、拉丁裔或祖先来自西班牙”。
1702629932
1702629933
在种族问题上存在的争执提醒我们,数据反映了社会。种族是一个社会概念,而不是一个生物学事实。在普查中,你可以决定自己属于哪个种族。种族在美国是一个敏感问题,出现争执也不足为奇。人口普查局的方法似乎是一种不错的折中之策。
1702629934
1702629935
1702629936
1702629937
1702629938
图1–1 2010年美国人口普查表第1页
1702629939
1702629940
观察研究
1702629941
1702629942
纽约扬基队的前接球手和经理约吉·贝拉,以其幽默的话语为人所知。他曾说:“你只要观察,就能看到很多东西。”有的时候,你能做的也只有观察了。想知道黑猩猩在野外的行为,你得观察。想研究老师和小朋友在教室中的互动行为,你也得观察。若观察者知道自己应该看的是什么,就会容易一些。黑猩猩专家可能对雌猩猩和雄猩猩的相互影响有兴趣,或者想知道黑猩猩群中的某几只黑猩猩是否有统治权,以及黑猩猩会不会猎食动物。事实上,大家一直以为黑猩猩是食草动物,直到珍妮·古道尔在坦桑尼亚的贡贝国家公园仔细观察了它们的行为。现在人们已经清楚地知道,肉类是黑猩猩日常饮食的一部分。
1702629943
1702629944
刚开始的时候,观察者可能不知道应该记录些什么。然而迟早会出现一些模式,帮助我们决定应该衡量哪些变量。比如,黑猩猩多久猎食一次?单独行动还是群体行动?多少只一起行动?只有雄性还是雌、雄都有?在它们的食物中肉类占多大比重?系统地观察,再加上清楚地定义变量,会比只观察更有说服力。以下是一个计划完善(且很花钱)的观察研究案例。
1702629945
1702629946
例3 高压电缆会引发儿童白血病吗?
1702629947
1702629948
电流产生磁场,所以电力会让人们暴露在磁场之中,住在高压电缆附近则增加了这种暴露的程度。强磁场确实会干扰实验室里做研究用的活细胞。如果我们住在高压电缆附近,那么磁场会对我们产生何种影响呢?一些数据表明,住在这种环境里,可能会有更多的儿童患上白血病。
1702629949
[
上一页 ]
[ :1.7026299e+09 ]
[
下一页 ]