1702650780
从样本推论总体——无论是否承认,它几乎总是社会科学家感兴趣的事情——从研究总体中抽取样本,必须知道总体中每个个体入样的概率。只有在这种情况下,统计推论的原则才适用。
1702650781
1702650782
尽管如此,许多研究依然违背此原则,抽取“方便的”或“随意的”样本。以此观点来看,中国社会调查是特别糟糕的,他们经常抽取一些省份或城市,却说它们代表了特定类型的地方;事实确实如此,即使是诸如中国健康和营养调查(Chinese Health and Nutrition Survey,CHNS)这类高质量的调查(Henderson et al.,1994)。这种做法的问题是没有办法知道没有被选择的地点在多大程度上和以什么方式确实与所选地点相似,且能被所选地点代表。总之,“有代表性的”地点样本不能代替概率样本。通常在抽样以及实地调查中,为设计一个能推论到研究总体的样本付出额外代价是非常值得的。
1702650783
1702650784
请一位外国人来设计调查 社会科学家在描述他们自己社会的特征方面非常糟糕。下面举一个恰当的例子:我在1996年中国调查的过程中,受到当地政府的反对,在某个县级城市街区无法进行实地调查。我的中国同事随意替换同一城市的另一个街区,他们说这个街区与调查受阻的街区非常相似,而不是让我从同一层中提供一个替代的地方(回顾第9章的介绍,基于人口的受教育程度我们有25个城镇分层)。但是,其结果是替代的街区属于第23层,而调查受阻的街区是在第18层,显然,这违背了分层抽样设计。
1702650785
1702650786
事实是,如果你希望掌握某一社会清晰、明确的特征,应该请一位外国人提出方案。Carnegie Corporation充分认识到这一关键点,他们委托瑞典经济学家和社会学家Gunnar Myrdal指导20世纪30年代美国的一项种族关系研究,其结果是产生了一部经典专著——《美国的困境》(An American Dilemma)(Myrdal,1944:vi-vii)。
1702650787
1702650788
超总体
1702650789
1702650790
然而,我们有时候希望把结论推论到抽样的总体之外,例如单次截面调查。尽管调查是在某一年进行的,但分析者通常想推论到那一年之外。再次援引1996年的中国调查,我的目标是将研究结论推论到“20世纪末期的中国人口”而不是“1996年夏天的中国人口”。通常情况下,这类结论是暗含的,直到一位评论家指出过去真实的现在已不再真实,这才成为问题。对评论家的回应常常采取这种偶尔明确但通常含糊其辞的方式,即援引“人种志意义上的现状”,认为正在描述的是1996年的中国社会“以及所有具有同样环境的社会”。也就是说,借用超总体(superpopulation)概念——被抽样的总体能代表类似总体在概念上的超总体。
1702650791
1702650792
另一个例子是一些被人类学家研究的社会,这些数据由Murdock及其同事们汇编而成〔如Murdock和Provost(1973)〕。因为不是所有小而孤立的社会都已经被人类学家们研究过,Murdock收集的数据不可能是这类社会的一个概率样本。尽管如此,此数据集的使用者仍然视之为各种社会的一个概率样本,其假设是:这些被19世纪和20世纪的人类学家们研究过的社会是所有这类社会超总体的代表。
1702650793
1702650794
GEORGE PETER MURDOCK(1897~1985)是一位人类学家,他反对美国人类学界普遍采用的研究方法,而提倡通过量化的、不同社会间的比较来检验不同假设并建立关于社会组织和人类行为的一般规则。他出生在康涅狄格州的一个第5代农场主家庭,在耶鲁获得美国历史学学士学位后,开始在哈佛法学院学习。他在第二年退出法学院,之后环球旅行了很长时间。旅行激发了他对人类学的兴趣。他未能被当时人类学系最具影响力的哥伦比亚大学录取,于是进入耶鲁大学,继续受Sumner进化思想的影响(这种思想与哥伦比亚Boas的社会特殊论针锋相对,后者后来成为人类学的主流)。他于1925年在耶鲁获得博士学位,并留在那里任教,度过大部分的职业生涯。1938年Murdock发表了他的第一篇比较研究文章,大约在同一时间他开始做一个项目——收集所有已知人类社会的数据。十年后〔“二战”时在海军服役后,他和学生写了一本关于密克罗尼西亚文化的《人种手册》(Ethnographic Handbooks),这是他们走出哥伦比亚大学的办公室工作取得的成绩〕,他认为如果资料能被广泛使用,那么他的数据收集将会更加有价值。他说服社会科学研究理事会(Social Sciences Research Council)资助他建立一个跨大学的组织,后来被称为人类关系地区档案(Human Relations Area Files,HRAF),这促进了大家使用他所收集的资料。1950年Murdock到匹兹堡大学工作,在那里创办了《人种学》(Ethnology)杂志,并继续比较数据的收集和研究。
1702650795
1702650796
在以机构为基础的研究中可以发现另一个例子——例如,关于医院、诊所和它们服务区的研究,经常被用在公共卫生研究中。对这种做法的辩解为,被研究的特定医院或诊所可以代表所有类似地点的情况,但它们仅仅可被认为是方便样本。
1702650797
1702650798
何时能够合理地援引超总体概念?当存在总体的数据并可以从中抽取概率样本时,我认为方便样本是很不好的替代,而且不符合当前的科学标准——尽管存在诸如研究生没有经费、没有时间之类的搪塞之词。但是,当不了解总体和总体不可知时,像Murdock和Provost的人种学样本的情况,运用已知数据并一般化到某一超总体是合理的。在基于调查时点某一总体的概率样本的单一截面调查的情况下,把所描述的社会特征看作是调查时点的社会特征时,结论是安全的,但当我们试图推论到其他时点时,就会越来越不可靠。尽管也可以这么做,但必须说明其合理性。
1702650799
1702650800
汇合多次调查数据 当超总体概念可以被合理地援引时,它就有相当多的实际用途。一项极富吸引力的应用是在可以获得随时间变化的可比较数据的时候,像美国的综合社会调查(GSS)及其他重复截面调查。如果可以证实研究所关注的变量之间的关系不随时间变化,那么就可以合并来自不同年份的数据以增大可用于分析的样本规模。当任何一年都没有足够的数据支持可靠的比较时——如对美国种族差异的研究,这是一个非常有用的策略。基本的检验方法是本章前面和第6章讨论的组间比较策略的一个变异(也可见第7章对趋势分析的讨论)。这可以分为两步。首先,估计下面形式的方程:
1702650801
1702650802
1702650803
1702650804
1702650805
这里,Xi是预测变量,Tj用于表示各截面调查(省略第一次调查是为了避免线性依赖)。其次,检验cj和dij是否共同为0。如果是,你可以得出所有样本来自一个单独总体的结论,并可以放心地汇合数据。但是,即使在Y的层次(cj之间有显著差异)或者在一个或多个X与Y的关系(dij之间有显著差异)方面存在随时间发生的变化,你也仍然希望汇合数据,但在研究社会过程时应该纳入虚拟变量和交互项以反映其随时间变化的方式。这样做的优点是可以同时分析关系随时间发生的变化并提升在评估那些不随时间变化的关系时的统计鉴定力。〔一些最近使用此策略的例子,见Barkan和Greenwood(2003)、Chen和Guilkey(2003)、Powers(2003)、Fitzgerald和Ribar(2004)、Kelly和Kelly(2005),及Tavits(2005)。〕
1702650806
1702650807
使用重复截面调查的另一种方法也值得推崇,即使用某一调查数据发展一个较佳的模型,用从数据中观测到的而不是理论预期的关系来修正模型。然后,再用另一个重复截面数据来检验该较佳的模型是否依然合适,例如,就GSS来讲,我们可以用在该年之前或之后进行的调查来检验模型(回想第7章关于此方法的讨论)。
1702650808
1702650809
最后一种可能性是,当家庭户中有多人的信息被收集(或者访谈多个家庭户成员,或者请一位受访者告知其他家庭户成员的特征)时,我们通过将有信息的每个人看作是一个单独个案来扩展样本。但是,在这种情况下,有必要解决观测值不相互独立的问题,可以用调查估计方法对家庭户内的聚集进行修正,或采用前面提到的由Mason(2001)提出的多层线性模型方法。此外,当只有受限的子样本的信息能够获得时,例如只有配偶的信息,有必要对后果给予特别关注——例如,应该对已婚人群样本和全部成人样本产生的结果差异进行敏感性分析(见下一节对敏感性分析的讨论)。
1702650810
1702650811
1702650812
1702650813
1702650815
量化数据分析:通过社会研究检验想法 最后一个建议:养成良好的专业素养
1702650816
1702650817
迄今为止,我们已经介绍了针对量化数据分析的各种问题,并对值得学习的高级技术做了简要介绍。我将通过提出做好专业研究的几点建议——能否掌握它们将有助于区分一般的和优秀的量化数据分析——来结束本书。这些是非常简单的原则,任何分析者都能够掌握;对它们的应用不要求有特别的才能或领悟力或数学能力。但是,重视它们一定会提高你的研究质量。
1702650818
1702650819
了解数据属性
1702650820
1702650821
无论你使用其他分析者的数据,还是从某一档案中得到的或你自己收集的数据,你都应该完全了解数据是如何创建的,而且也应该熟悉它们的属性。对抽样设计给予特别关注,判断调查估计是否可能以及如何实现。出于同样的原因,你需要了解加权变量是如何构建的,以及如何使用它们。通常,原调查者对所提供的权重没有说明清楚。就如何构建权重的问题,给调查者写信询问是完全恰当的做法。你不必认为这是强人所难——尽管这确实可能有困难——因为那些让公众使用他们数据的调查者的责任之一就是提供充分的文本说明。
1702650822
1702650823
你也应该计算和检查数据集中每个变量的单变量频数分布,或至少分析与你的研究有关的每个变量。用Stata中的-codebook-命令很容易完成。对于每个变量——鉴于你对研究总体的了解——问你自己观测到的分布是否可以接受。检查单变量频数分布所能提供的信息是非常令人吃惊的。接下来的一步是创建交互表,或表示每个关键因变量与所有备选预测变量之间关系的均值表格。这也会提供一些非常重要的反映数据缺陷和先验假设不足方面的信息。
1702650824
1702650825
我依然会想起45年前当我还是芝加哥大学一名新入校的研究生时发生的一件事情。我当时在全国民意研究中心(National Opinion Research Center,NORC)做研究助理工作,Peter Rossi当时是NORC的主任。某一天晚上,正当他抱着一大摞计算机打印结果——我们正进行研究的交互表——离开大楼时,我遇到了他。我对于我们现在就可以用计算机做回归却仍费力去做这些交互表做了一些暗讽的评论,他看了我一眼,并语重心长地说,“学无止境,年轻人”,这让我感到有点无地自容。当然,他是完全正确的。在仓促地开始估计花哨的或不怎么花哨的模型之前,我们可以从熟悉数据中学到很多东西。
1702650826
1702650827
在美国,公共资助的研究必须与研究社区共享 现在国家科学基金(National Science Foundation,NSF)和国家健康研究院(National Institute of Health,NIH)都要求它们资助的抽样调查以及时的方式让公众使用。目前NIH的政策是,“NIH支持最终研究数据的共享……并且希望和支持及时发布与共享由NIH资助研究的最终研究数据,供其他研究者使用。‘及时发布与共享’是指不能晚于最终数据集的主要发现被接受出版的时间”(http://grants.nih.gov/grants/policy/nihgps_2003/NIHGPS_Part7.htm#_Toc54600131,登录日期为2007年12月9日)。NSF的政策陈述不是很精确但却表达了同样的原则:“NSF希望……在不增加成本及合理的时间内,项目主持人与其他研究者共享数据、样本、所搜集的材料及其他在工作过程中创建或收集的有用资料。也鼓励受资助者共享软件和发明,或以别的方式使创新成果最大限度地有用和得到应用”(http://www.nsf.gov/pubs/2001/gc101rev1.pdf,登录时间为2007年12月9日)。提供充分的文本是其要求的一部分。
1702650828
1702650829
探讨可替代先验假设的其他解释
[
上一页 ]
[ :1.70265078e+09 ]
[
下一页 ]