打字猴:1.7026461e+09
1702646100
1702646101 此过程被称为调试程序。在做这一步时,你们会有一个含一组结果的-log-文件和一个-do-文件。①它们提供了如何获得-log-文件中的结果的清楚、完整的记录;②可以在任何时间重复运行——如果你们在分析逻辑上发现一个错误或者更新了数据集,你们就会这样做,这是经常发生的。同样,尽管我们总是希望在研究论文中完整地描述我们的计算操作,但这实际上是非常困难的。这意味着如果你们提交了一篇论文给出版社,并收到回信要求“修改和再提交”此论文,那么准确找到你们过去几个月或多年前做的计算和假设的最好方法就是查看你们的-do-文件。能有一个这样的-do-文件将大大加快你们的修改工作。
1702646102
1702646103 养成深入检查自己工作的习惯
1702646104
1702646105 在通过计算机做数据分析时,非常容易犯错——无论是逻辑上的还是笔误。避免自己为了错误结果而编故事的唯一办法是强迫检查自己的工作。你们可以从两方面着手:首先,检查每一步数据变换命令的逻辑——好比纸笔运算——查看被变换变量的每一个值是如何受每个命令影响的。其次,查看每个新变量的频数表或描述统计,认真查看输出结果。你们会很惊讶地发现在这两个简单步骤中竟然可以找到如此多的错误!
1702646106
1702646107 详尽记录-do-文件
1702646108
1702646109 你们应该在-do-文件中详细说明每步命令的目的和背后的逻辑关系——特别是在做数据变换时。包含概述每步命令结果的评论将使你们很清楚为什么要进行下一步分析。这样,-do-文件就成为一个总结全部分析过程的文件。详细记录的重要性,我总觉得再怎么强调都不过分。尤其是在我们这个领域,常常同时研究几个问题,几个月或几年后又回过头研究其中的一个问题。此外,编辑评审过程通常需要很长时间。如果你们没有针对之前所做的研究工作做好-do-文件,就要费很大劲才能回忆起你们为什么要做这项工作。这是没有效率的,而且很可能非常令人尴尬——假如杂志编辑要求你们做些额外的分析时,你们不知道当时为什么要做此计算,更不用说其中的逻辑是什么,而且也不能再现以前的结果。这种情况发生的频率远远高于我们愿意承认的次数。
1702646110
1702646111 在-do-文件中包含“辅助”计算
1702646112
1702646113 这是对上面详尽记录文件的一点补充。我们经常在写文章时做一些“辅助”计算,或者在行文中添加描述内容。例如,计算表中两个系数的比率或其他文章中两个变量之间的相关系数。使你们的-do-文件成为一个包含所有计算的综合文件的方法是,用Stata完成工作而不是用计算器或电子数据表来完成所有的计算。不止一次,我写完了文章并附一个完整的-do-文件,但没有将“辅助”计算包含其中,结果几个月后我发现我完全不知道文章中提到的“辅助”系数是如何得出来的。
1702646114
1702646115 作为最后的检查,再次运行-do-文件
1702646116
1702646117 当你写完一篇论文并准备提交给任课老师或作为讨论稿系列上传到网上或出版时,你们应该特别重视完整地运行一下-do-文件,然后核实论文中每一个系数是否与-log-文件中的一致。你们可能会很惊讶地发现有如此多的不一致。因为-do-文件经常是在很长一段时间内创建的,而且经常是分段运行的,所以非常容易产生一些不一致的地方。如果你们有一个-do-文件,它能够从开始运行到结束而没有中断,且产生论文中的每一个结果,那么你们就有了一份极标准的记录文件。几个月或几年后,当你们需要做一个影响许多结果的小修改时,你们也会非常轻松。你们会发现这种修改经常只需要几分钟——尽管手工更新表格常常是一项更加乏味、耗时的工作。
1702646118
1702646119 用好Stata手册
1702646120
1702646121 要想对任何统计软件包括Stata运用自如的唯一方法是不断提高你们的技能。每次当你们不知道如何完成一项任务时,可以去手册中寻找解决办法。你们会发现技能的提高带来的回报非常大。当你们对Stata驾轻就熟时,你们以后就可以利用Stata中的-net-命令,它能使你链接到Stata使用者社区了解最新的应用。当然,要使用-net-命令,你们必须能够与因特网相连接。
1702646122
1702646123
1702646124
1702646125
1702646126 量化数据分析:通过社会研究检验想法 [:1702644746]
1702646127 量化数据分析:通过社会研究检验想法 一些特别有用的Stata 10.0命令
1702646128
1702646129 这里罗列了一些数据处理和应用的关键命令。除了阅读用户指南外,学习Stata手册中关于这些命令的描述会更有帮助。你们花在熟悉这些命令和Stata程序逻辑上的时间将会比你们从工作效率的提高中获得的好处多得多。我罗列了一些有关执行估计步骤的命令,因为我将在后面章节中介绍它们。
1702646130
1702646131 adjust  获得均值和比例的修正值。
1702646132
1702646133 append  合并两个变量一致但观测样本不一样的数据集(也参见-merge-)。
1702646134
1702646135 by    对数据的子样本重复同样的Stata命令。
1702646136
1702646137 capture  获取返回代码(即不管这个条件是否存在,允许Stata继续运行)。
1702646138
1702646139 cd    改变工作目录。
1702646140
1702646141 codebook 产生描述数据的编码本。
1702646142
1702646143 collapse 产生数据子样本的总体统计量,如均值(这个命令在画图的时候非常有用,其功能类似于SPSS中的“aggregate”命令)。
1702646144
1702646145 compress 压缩变量使数据集变小,但不改变任何变量的逻辑特征。当数据不能被读进内存时,它非常有用。
1702646146
1702646147 count   给出满足某些具体条件的观测样本数量。不加后缀的-count-命令给出数据集中观测样本的数量。
1702646148
1702646149 #delimit 改变定义界限的字符。
[ 上一页 ]  [ :1.7026461e+09 ]  [ 下一页 ]