打字猴:1.702650842e+09
1702650842
1702650843 当然,你的期望是不同的设定方法会产生相似的结果。然而,即使结果不同,你也要报告所有的发现。记住:目标不是“证明”一个假设而是发现社会是如何实际运行的。有时候,这意味着我们必须得出结论:因为结果在不同的设定条件下不稳健,所以我们的数据给予的信息不够。
1702650844
1702650845 Hout和Hauser(1992)批评了Erikson和Goldthorpe有关社会流动的重要的比较研究,Constant Flux(1992b)表明Erikson和Goldthorpe的结果在模型设定、所使用的统计方法或在职业分类的汇总水平上不稳健,也可以见Erikson和Goldthorpe的回应(1992a)。他们的交流提供了一个非常有启发性的例子,说明你最好自己做敏感性分析,免得评论家替你做。有一个让人注意的例子:一项带有偏见、做得很马虎且备受争议的研究经批评家们的尖锐批评最终被彻底推翻,见Herrnstein和Murray(1994)、Heckman(1995)的重要评论、Fischer等(1996)、Hauser和Huang(1997)。
1702650846
1702650847 一种有用的方法是将你们的结果“相提并论”,不仅报告点估计而且报告在不同假设下得出的估计值范围。例如,对于一次态度测量,如果你不清楚应该将回答“不知道”编码为“缺失”还是赋予介于正面和负面态度之间的中间值,那么将这两种方法都尝试一下并评估其结果,当然,两个结果都应报告。
1702650848
1702650849 记录你的研究过程
1702650850
1702650851 你应该用命令文件(Stata中的-do-文件)进行所有分析,并在每次执行命令文件时生成命令和结果日志(Stata中的-log-文件)。此外,你应该在命令文件中给出详细说明,对你做的每一步分析和为什么这样做做出说明。在我自己的工作中,我会更进一步对结果做出评论。
1702650852
1702650853 这样做有几个优点。首先,它记录了你所做的工作。社会科学研究成果从最初的想法到发表文章经常会持续几年。即使你是一个有效率的人(即每次只做一件事情,所以能够实现从开始到结束分析只花几周的时间),你也得向期刊提交文章,而期刊一般会在几个月后才给你反馈,通常会要求你在修改后再提交,那就意味着要做些补充分析。此时,你一定不想处于这样的尴尬境地:不记得表和图中的统计量是如何计算的,更糟糕的是无法重现结果。如果有记录得很清楚的命令文件,那么你就能够弄清楚你做了什么和为什么这么做。
1702650854
1702650855 其次,你可以调整分析并高效地进行新的计算。例如,假设审阅人建议你增加一个控制变量。如果你有现成的命令文件,这就是一项非常简单的工作。你只需要简单地在模型中增加此变量,然后运行命令文件。这要比将你的整个分析重新来过好得多。
1702650856
1702650857 最后,将你的日志文件建档以便在需要时提供,这使得别人能够重复或挑战你的发现。你或许不想说明研究的细节,免得别人发现其中的错误。但科学不是这样进步的——清楚(即使是错误的)远比含糊好。如果你把过程弄得很清楚,那么别人就可以准确地重复你所做的工作,并可能想出更好的方法。记住,这个游戏的目标是促进我们对社会结构和过程的共同理解。
1702650858
1702650859 当然,对于研究文章的最高标准是,它们包含能准确复制研究所必需的所有信息。你的目标应该是做好完整的工作记录,其结果是,如果你给一个称职的分析者提交文章和数据集,他或她可以重现你文章中的每个数字。这个目标是非常值得称赞的,然而,它往往会受挫于期刊编辑,因为编辑坚持要省略技术细节以缩短文章。所以,除了在你的文章中尽可能清楚地介绍技术方法外,将日志文件建档是非常好的专业素养。
1702650860
1702650861 最后一遍查错
1702650862
1702650863 在你提交文章(或提交学期论文,或学位论文的某一章,或把文章放到工作讨论稿系列上)之前,要做的最后一件事情是运行命令文件,然后对照日志文件中相应的数字检查文章中的每一个数字。你会对所能发现的众多不一致感到惊讶。因为完成一篇专业文章是一个非常漫长的过程,在不经意间就会掺杂进来一些不一致的东西。你的目标应该是生成一个包括分析所需要的所有计算的命令文件。即使在你分析一个以上的数据集的情况下,也建议你将所有命令整合到一个单独文件中。这样,你就创建了一个生成和解释所有研究工作的单独文本。你也减少了以下情况发生的可能性,例如,部分分析可能遗漏记录或丢失文本记录。出于同样的原因,你应该将辅助计算——即使是手工计算——也纳入命令文件(Stata的-display-命令提供了与计算器一样的功能)。
1702650864
1702650865 一个“可从作者处索要”的文档 因为在发表了的文章中声称补充资料“可从作者处索要”经常被证明是假的——至少在发表了几个月之后是这样,所以在UCLA的加州人口研究中心(California Center for Population Research,CCPR)最近建立了一个系统,如-do-和-log-文件等补充资料可以附在人口讨论稿(Population Working Paper)资料库中发表的文章上。希望其他研究中心也效仿这种做法。
1702650866
1702650867 这样做所效仿的标准——至少部分地——是常规地保存在化学实验室中的实验报告。实验报告记录了某一实验进行的条件,包括房间的温度和湿度、试剂是否某一天被泼在地板上(同时记录了准确时间、泼出了什么和滴在哪里)、每一步实验的结果,以及成功还是失败。我们不需要记录得那么详细。记录我们在运行文件的过程中所犯的错误没有多大意义。但是,我们应该记录在分析时所遭遇的“死胡同”、未能证明的假设、被证明是错误的假设等。你会发现在几个月或几年后再来分析时这些注释非常有帮助。就像我所说的,几个月或几年这样的时间间隔并不罕见。此外,通过对分析中的“死胡同”做好记录并建立档案,你也可能帮助了其他分析者。
1702650868
1702650869
1702650870
1702650871
1702650872 量化数据分析:通过社会研究检验想法 [:1702644846]
1702650873 量化数据分析:通过社会研究检验想法 本章小结
1702650874
1702650875 我在本章回顾了一些做好研究设计的一般要点;简要介绍了许多你在更高一级的课程或独立研究中可能遇到的高级统计技术和方法;强调了概率抽样的价值;给出了一些做好实际研究的建议。以本书介绍的资料为基础,你已经具备了对抽样调查和其他数据做高质量严谨分析的条件。但是你不应就此止步,因为在社会科学中统计方法发展得非常快,数据分析的初级课程对掌握最新的技术而言是不够的,我在本章中介绍了一些最新的技术。因此,我鼓励你将本书看作继续充实你的工具箱的开始并终身学习,就像我自获得博士学位以来的40多年里所做的一样。如果像我这样的老家伙都能学点新东西,你也一定能做到!祝学习愉快!
1702650876
1702650877
1702650878
1702650879
1702650880 量化数据分析:通过社会研究检验想法 [:1702644847]
1702650881 量化数据分析:通过社会研究检验想法 附录A 书中所用数据的说明和下载地址
1702650882
1702650883 此附件介绍了书中所有例子的数据来源及说明。这些数据所涉及调查的一个共同特征是,它们都是家庭户调查,这意味着数据需要用家庭户中成人数的倒数进行加权转变成个人样本——见第9章对此问题的讨论。它们都是基于家庭户的概率抽样,抽样设计的详细内容可以参阅该附录参考文献中的有关内容。
1702650884
1702650885 中国
1702650886
1702650887 1996年调查——当代中国生活史与社会变迁调查(Life History and Social Change in Contemporary China)(Treiman,Walder,and Li,2006),是由中国人民大学的教师和学生进行的,由美国国家科学基金(U.S.National Science Foundation,SBR-9423453)、福特基金北京办事处和Luce基金会资助。调查负责人是Donald J.Treiman(UCLA)、Andrew G.Walder(斯坦福大学)和李强(当时在中国人民大学,现在清华大学)。该调查收集了受访者的社会经济特征和受教育程度、职业、家庭史等信息,以及有关其配偶、父母、子女和其他家庭成员的信息。
1702650888
1702650889 该调查是基于20~69岁中国人口的一个分层全国性概率抽样,获得6090个个人样本,以及383位村干部的特殊样本。有关抽样设计的详细内容见Treiman(1998)。
1702650890
1702650891 该数据和相关文本可以从UCLA的社会科学数据档案库(UCLA Social Science Data Archive)网站(http://sscnet.ucla.edu/issr/da)下载,依次点击Catalog、Index、Asia-China和Life History and Social Change in Contemporary China,1996。
[ 上一页 ]  [ :1.702650842e+09 ]  [ 下一页 ]