打字猴:1.702650805e+09

1702650805 这里，Xi是预测变量，Tj用于表示各截面调查（省略第一次调查是为了避免线性依赖）。其次，检验cj和dij是否共同为0。如果是，你可以得出所有样本来自一个单独总体的结论，并可以放心地汇合数据。但是，即使在Y的层次（cj之间有显著差异）或者在一个或多个X与Y的关系（dij之间有显著差异）方面存在随时间发生的变化，你也仍然希望汇合数据，但在研究社会过程时应该纳入虚拟变量和交互项以反映其随时间变化的方式。这样做的优点是可以同时分析关系随时间发生的变化并提升在评估那些不随时间变化的关系时的统计鉴定力。〔一些最近使用此策略的例子，见Barkan和Greenwood（2003）、Chen和Guilkey（2003）、Powers（2003）、Fitzgerald和Ribar（2004）、Kelly和Kelly（2005），及Tavits（2005）。〕

1702650806

1702650807 使用重复截面调查的另一种方法也值得推崇，即使用某一调查数据发展一个较佳的模型，用从数据中观测到的而不是理论预期的关系来修正模型。然后，再用另一个重复截面数据来检验该较佳的模型是否依然合适，例如，就GSS来讲，我们可以用在该年之前或之后进行的调查来检验模型（回想第7章关于此方法的讨论）。

1702650808

1702650809 最后一种可能性是，当家庭户中有多人的信息被收集（或者访谈多个家庭户成员，或者请一位受访者告知其他家庭户成员的特征）时，我们通过将有信息的每个人看作是一个单独个案来扩展样本。但是，在这种情况下，有必要解决观测值不相互独立的问题，可以用调查估计方法对家庭户内的聚集进行修正，或采用前面提到的由Mason（2001）提出的多层线性模型方法。此外，当只有受限的子样本的信息能够获得时，例如只有配偶的信息，有必要对后果给予特别关注——例如，应该对已婚人群样本和全部成人样本产生的结果差异进行敏感性分析（见下一节对敏感性分析的讨论）。

1702650810

1702650811

1702650812

1702650813

1702650814 量化数据分析：通过社会研究检验想法 [:1702644845]

1702650815 量化数据分析：通过社会研究检验想法最后一个建议：养成良好的专业素养

1702650816

1702650817 迄今为止，我们已经介绍了针对量化数据分析的各种问题，并对值得学习的高级技术做了简要介绍。我将通过提出做好专业研究的几点建议——能否掌握它们将有助于区分一般的和优秀的量化数据分析——来结束本书。这些是非常简单的原则，任何分析者都能够掌握；对它们的应用不要求有特别的才能或领悟力或数学能力。但是，重视它们一定会提高你的研究质量。

1702650818

1702650819 了解数据属性

1702650820

1702650821 无论你使用其他分析者的数据，还是从某一档案中得到的或你自己收集的数据，你都应该完全了解数据是如何创建的，而且也应该熟悉它们的属性。对抽样设计给予特别关注，判断调查估计是否可能以及如何实现。出于同样的原因，你需要了解加权变量是如何构建的，以及如何使用它们。通常，原调查者对所提供的权重没有说明清楚。就如何构建权重的问题，给调查者写信询问是完全恰当的做法。你不必认为这是强人所难——尽管这确实可能有困难——因为那些让公众使用他们数据的调查者的责任之一就是提供充分的文本说明。

1702650822

1702650823 你也应该计算和检查数据集中每个变量的单变量频数分布，或至少分析与你的研究有关的每个变量。用Stata中的-codebook-命令很容易完成。对于每个变量——鉴于你对研究总体的了解——问你自己观测到的分布是否可以接受。检查单变量频数分布所能提供的信息是非常令人吃惊的。接下来的一步是创建交互表，或表示每个关键因变量与所有备选预测变量之间关系的均值表格。这也会提供一些非常重要的反映数据缺陷和先验假设不足方面的信息。

1702650824

1702650825 我依然会想起45年前当我还是芝加哥大学一名新入校的研究生时发生的一件事情。我当时在全国民意研究中心（National Opinion Research Center，NORC）做研究助理工作，Peter Rossi当时是NORC的主任。某一天晚上，正当他抱着一大摞计算机打印结果——我们正进行研究的交互表——离开大楼时，我遇到了他。我对于我们现在就可以用计算机做回归却仍费力去做这些交互表做了一些暗讽的评论，他看了我一眼，并语重心长地说，“学无止境，年轻人”，这让我感到有点无地自容。当然，他是完全正确的。在仓促地开始估计花哨的或不怎么花哨的模型之前，我们可以从熟悉数据中学到很多东西。

1702650826

1702650827 在美国，公共资助的研究必须与研究社区共享现在国家科学基金（National Science Foundation，NSF）和国家健康研究院（National Institute of Health，NIH）都要求它们资助的抽样调查以及时的方式让公众使用。目前NIH的政策是，“NIH支持最终研究数据的共享……并且希望和支持及时发布与共享由NIH资助研究的最终研究数据，供其他研究者使用。‘及时发布与共享’是指不能晚于最终数据集的主要发现被接受出版的时间”（http：//grants.nih.gov/grants/policy/nihgps_2003/NIHGPS_Part7.htm#_Toc54600131，登录日期为2007年12月9日）。NSF的政策陈述不是很精确但却表达了同样的原则：“NSF希望……在不增加成本及合理的时间内，项目主持人与其他研究者共享数据、样本、所搜集的材料及其他在工作过程中创建或收集的有用资料。也鼓励受资助者共享软件和发明，或以别的方式使创新成果最大限度地有用和得到应用”（http：//www.nsf.gov/pubs/2001/gc101rev1.pdf，登录时间为2007年12月9日）。提供充分的文本是其要求的一部分。

1702650828

1702650829 探讨可替代先验假设的其他解释

1702650830

1702650831 真正好的研究文章的特征之一是，作者预期并探讨了批评者可能提出的对观察到的现象或关系的所有其他可能的解释。在非实验性研究中，寻找不同解释通常是为了评估因为没有纳入同时影响模型中自变量和因变量的变量而导致虚假相关的可能性。因此，你需要问自己：“对于我所观测到的相关有别的解释吗？尤其是有没有别的什么变量影响了我观测到的结果和预测变量的取值？”如果可能，在你的模型中纳入备选变量，或做一项辅助分析（甚至使用不同的数据）来深入研究这些变量与模型中已有变量之间的关系。

1702650832

1702650833 运用此方法的一个好的例子是Miller（2007）的一篇文章，他探讨了20世纪初给予妇女投票权是否会导致公共卫生开支增加从而降低儿童死亡率。他发现有很强的证据支持这个结论。但是他认识到，在接受此因果观点为有效之前，需要排除一种可能性，即投票权立法是内生性的，有一些因素同时影响了投票权的授予和公共卫生开支的增加。因此，他在文章（第24～28页）中专门用一节尝试了多种“有效性检验”以排除他所得到的结果有其他解释的可能性。

1702650834

1702650835 当潜在影响结论的其他变量无法被观测到时，刚才讨论的方法就不可行，但我们可以尝试排除其他可能的解释——通过说明如果它们在起作用，其预测效应会与我们所观测到的不同。例如，在一篇分析中国识字水平影响因素的文章（Treiman，2007a）中，我发现体力劳动者和非体力劳动者在识字水平上的差异随年龄增大，我认为这证明了“非体力劳动随生命历程提高了劳动者的识字水平而体力劳动抑制了其发展的假设”。但是，在接受此结论之前，我需要排除一种可能性，即1996年测量到的年龄差异只不过反映了中国历史变化导致的不同队列在识字水平上的差异。我指出，如果教育质量随时间提高（或下降），我们会预期体力劳动者和非体力劳动者的识字水平都提高（或降低），而不会观测到差异增大的模式。我用类似的方法排除了另一种可能性，即当非体力劳动部门发展时，非体力劳动者和体力劳动者的平均“质量”下降了。

1702650836

1702650837 在某些情况下还有另一种选择，即像我们在前一章所做的那样通过估计固定效应或随机效应模型，从分析中排除未被测量到的潜在的影响结论的因素。还有另一种可能性是通过使用本章前面讨论的处理内生性和样本选择偏误的两种方法之一来修正潜在地影响结论的因素效应。

1702650838

1702650839 进行敏感性分析

1702650840

1702650841 另一种让你对结果的稳健性增强自信心——也使读者对它更有信心——的方法是做敏感性分析（sensitivity analysis）。例如，尝试用不同的函数形式来表示在一般线性模型框架内呈现的关系，在进行表格分析时尝试不同的分界点，以及更一般地，探讨测量概念的不同方法。像考虑潜在忽略变量偏误一样，这种探索也可能会超出所分析的数据集。例如，Treiman和Roos（1983：620-621）通过用就业质量调查（Quality Employment Survey）数据比较了两种测量的估计值——实际劳动经历及其代理测量（=年龄减去受教育年限再减去6），评估了标准代理变量的适用性。

1702650842

1702650843 当然，你的期望是不同的设定方法会产生相似的结果。然而，即使结果不同，你也要报告所有的发现。记住：目标不是“证明”一个假设而是发现社会是如何实际运行的。有时候，这意味着我们必须得出结论：因为结果在不同的设定条件下不稳健，所以我们的数据给予的信息不够。

1702650844

1702650845 Hout和Hauser（1992）批评了Erikson和Goldthorpe有关社会流动的重要的比较研究，Constant Flux（1992b）表明Erikson和Goldthorpe的结果在模型设定、所使用的统计方法或在职业分类的汇总水平上不稳健，也可以见Erikson和Goldthorpe的回应（1992a）。他们的交流提供了一个非常有启发性的例子，说明你最好自己做敏感性分析，免得评论家替你做。有一个让人注意的例子：一项带有偏见、做得很马虎且备受争议的研究经批评家们的尖锐批评最终被彻底推翻，见Herrnstein和Murray（1994）、Heckman（1995）的重要评论、Fischer等（1996）、Hauser和Huang（1997）。

1702650846

1702650847 一种有用的方法是将你们的结果“相提并论”，不仅报告点估计而且报告在不同假设下得出的估计值范围。例如，对于一次态度测量，如果你不清楚应该将回答“不知道”编码为“缺失”还是赋予介于正面和负面态度之间的中间值，那么将这两种方法都尝试一下并评估其结果，当然，两个结果都应报告。

1702650848

1702650849 记录你的研究过程

1702650850

1702650851 你应该用命令文件（Stata中的-do-文件）进行所有分析，并在每次执行命令文件时生成命令和结果日志（Stata中的-log-文件）。此外，你应该在命令文件中给出详细说明，对你做的每一步分析和为什么这样做做出说明。在我自己的工作中，我会更进一步对结果做出评论。

1702650852

1702650853 这样做有几个优点。首先，它记录了你所做的工作。社会科学研究成果从最初的想法到发表文章经常会持续几年。即使你是一个有效率的人（即每次只做一件事情，所以能够实现从开始到结束分析只花几周的时间），你也得向期刊提交文章，而期刊一般会在几个月后才给你反馈，通常会要求你在修改后再提交，那就意味着要做些补充分析。此时，你一定不想处于这样的尴尬境地：不记得表和图中的统计量是如何计算的，更糟糕的是无法重现结果。如果有记录得很清楚的命令文件，那么你就能够弄清楚你做了什么和为什么这么做。

1702650854

[ 上一页 ] [ :1.702650805e+09 ] [ 下一页 ]