1702646090
1702646091
[此命令将数据读进内存。-do-文件的其余部分包括对数据进行各类操作并产生各种计算结果的命令。]
1702646092
1702646093
……
1702646094
1702646095
log close;
1702646096
1702646097
[此命令关闭-log-文件,因此它可以由编辑窗口或文字处理器打开。]
1702646098
1702646099
创建和成功执行一个-do-文件的基本步骤是:①打开一个新文件(在Stata的编辑窗口,或你们喜欢的文字编辑器,或ASCII编辑窗口),记住-do-文件必须包含扩展名“do”。②插入在前面列出来的那些命令(我总是从以前的文件中拷贝这些命令到当前文件,以尽可能少打字)。③创建一组命令,以做初步工作。④保存文件(存成ASCII文件)。⑤通过键入do<文件名>告诉Stata并执行-do-文件;注意,如果出现任何错误(大多数情况下一定会有错误),命令的运行就会终止。⑥回到编辑窗口,更改错误或添加分析命令。⑦重复上述步骤直到-do-文件包括所有必需的分析步骤,使得所有命令语句可以执行到底。
1702646100
1702646101
此过程被称为调试程序。在做这一步时,你们会有一个含一组结果的-log-文件和一个-do-文件。①它们提供了如何获得-log-文件中的结果的清楚、完整的记录;②可以在任何时间重复运行——如果你们在分析逻辑上发现一个错误或者更新了数据集,你们就会这样做,这是经常发生的。同样,尽管我们总是希望在研究论文中完整地描述我们的计算操作,但这实际上是非常困难的。这意味着如果你们提交了一篇论文给出版社,并收到回信要求“修改和再提交”此论文,那么准确找到你们过去几个月或多年前做的计算和假设的最好方法就是查看你们的-do-文件。能有一个这样的-do-文件将大大加快你们的修改工作。
1702646102
1702646103
养成深入检查自己工作的习惯
1702646104
1702646105
在通过计算机做数据分析时,非常容易犯错——无论是逻辑上的还是笔误。避免自己为了错误结果而编故事的唯一办法是强迫检查自己的工作。你们可以从两方面着手:首先,检查每一步数据变换命令的逻辑——好比纸笔运算——查看被变换变量的每一个值是如何受每个命令影响的。其次,查看每个新变量的频数表或描述统计,认真查看输出结果。你们会很惊讶地发现在这两个简单步骤中竟然可以找到如此多的错误!
1702646106
1702646107
详尽记录-do-文件
1702646108
1702646109
你们应该在-do-文件中详细说明每步命令的目的和背后的逻辑关系——特别是在做数据变换时。包含概述每步命令结果的评论将使你们很清楚为什么要进行下一步分析。这样,-do-文件就成为一个总结全部分析过程的文件。详细记录的重要性,我总觉得再怎么强调都不过分。尤其是在我们这个领域,常常同时研究几个问题,几个月或几年后又回过头研究其中的一个问题。此外,编辑评审过程通常需要很长时间。如果你们没有针对之前所做的研究工作做好-do-文件,就要费很大劲才能回忆起你们为什么要做这项工作。这是没有效率的,而且很可能非常令人尴尬——假如杂志编辑要求你们做些额外的分析时,你们不知道当时为什么要做此计算,更不用说其中的逻辑是什么,而且也不能再现以前的结果。这种情况发生的频率远远高于我们愿意承认的次数。
1702646110
1702646111
在-do-文件中包含“辅助”计算
1702646112
1702646113
这是对上面详尽记录文件的一点补充。我们经常在写文章时做一些“辅助”计算,或者在行文中添加描述内容。例如,计算表中两个系数的比率或其他文章中两个变量之间的相关系数。使你们的-do-文件成为一个包含所有计算的综合文件的方法是,用Stata完成工作而不是用计算器或电子数据表来完成所有的计算。不止一次,我写完了文章并附一个完整的-do-文件,但没有将“辅助”计算包含其中,结果几个月后我发现我完全不知道文章中提到的“辅助”系数是如何得出来的。
1702646114
1702646115
作为最后的检查,再次运行-do-文件
1702646116
1702646117
当你写完一篇论文并准备提交给任课老师或作为讨论稿系列上传到网上或出版时,你们应该特别重视完整地运行一下-do-文件,然后核实论文中每一个系数是否与-log-文件中的一致。你们可能会很惊讶地发现有如此多的不一致。因为-do-文件经常是在很长一段时间内创建的,而且经常是分段运行的,所以非常容易产生一些不一致的地方。如果你们有一个-do-文件,它能够从开始运行到结束而没有中断,且产生论文中的每一个结果,那么你们就有了一份极标准的记录文件。几个月或几年后,当你们需要做一个影响许多结果的小修改时,你们也会非常轻松。你们会发现这种修改经常只需要几分钟——尽管手工更新表格常常是一项更加乏味、耗时的工作。
1702646118
1702646119
用好Stata手册
1702646120
1702646121
要想对任何统计软件包括Stata运用自如的唯一方法是不断提高你们的技能。每次当你们不知道如何完成一项任务时,可以去手册中寻找解决办法。你们会发现技能的提高带来的回报非常大。当你们对Stata驾轻就熟时,你们以后就可以利用Stata中的-net-命令,它能使你链接到Stata使用者社区了解最新的应用。当然,要使用-net-命令,你们必须能够与因特网相连接。
1702646122
1702646123
1702646124
1702646125
1702646127
量化数据分析:通过社会研究检验想法 一些特别有用的Stata 10.0命令
1702646128
1702646129
这里罗列了一些数据处理和应用的关键命令。除了阅读用户指南外,学习Stata手册中关于这些命令的描述会更有帮助。你们花在熟悉这些命令和Stata程序逻辑上的时间将会比你们从工作效率的提高中获得的好处多得多。我罗列了一些有关执行估计步骤的命令,因为我将在后面章节中介绍它们。
1702646130
1702646131
adjust 获得均值和比例的修正值。
1702646132
1702646133
append 合并两个变量一致但观测样本不一样的数据集(也参见-merge-)。
1702646134
1702646135
by 对数据的子样本重复同样的Stata命令。
1702646136
1702646137
capture 获取返回代码(即不管这个条件是否存在,允许Stata继续运行)。
1702646138
1702646139
cd 改变工作目录。
[
上一页 ]
[ :1.70264609e+09 ]
[
下一页 ]