1702650130
1702650131
1702650132
续表
1702650133
1702650134
1702650135
1702650136
1702650137
正如我们所看到的,每个变量的影响效应在类别之间有很大的不同。例如,居住在南方这一变量既没有将坚定的民主党人士或倾向于民主党的人士(包括坚定的和不坚定的民主党人士)与相对更倾向于共和党的人士区分开来,也没有将坚定的共和党人士与其他人群区分开来,但它确实显著地影响了其他区分。类似地,居住在SMSA之外对中间类别的影响要大于对两端类别的影响,而且,区分模式没有呈现很强的系统性。
1702650138
1702650139
根据我的判断,因为gologit模型比ologit模型复杂得多,用-gologit2-代替-ologit-来估计需要满足两个条件:其一,需要表明成比例比率假设不恰当;其二,gologit模型的系数是可解释的且是有意义的。要判断成比例比率假设是否不恰当,我们估计gologit模型并检验每个分界点所对应系数的等价性。在当前的例子中,我们拒绝系数相等的零假设(χ2=147,自由度为30;p<0.0000)。但是,我很难对各分界点所对应系数的差异做出明确的解释。因此,出于简约性考虑,我倾向于选择常规的序次logit模型。
1702650140
1702650141
用Stata估计一般化序次logit模型 估计一般化序次logit模型的一种常规方法的程序最早由Vincent Fu(Fu,1998)编写,他当时还只是UCLA的一名研究生。Williams(2006)改进了Fu的方法。Williams的-ado-文件-gologit2-可以在Stata中下载。键入“net search gologit2”,点击第一个条目,然后选择“Click here to install”。
1702650142
1702650143
常规最小二乘法也是一种选择 最后,我们可以将因变量当作间距变量(interval variable)来估计常规最小二乘方程。这相当于假设任何一对相邻类别之间的距离是一样的。在当前的例子中,其结果是,OLS模型得到的系数(见表14-5)与ologit模型得到的系数十分相似。因此,我们也可以简单地估计一个OLS模型,它估计和解释起来都比ologit模型简单得多。麻烦在于,除非我们同时用这两种方法来分析,否则我们真的不知道其结果在某一特定情形下是否相似。因此,一种合理的策略就是同时用两种方法来分析,如果发现结果相似,那就报告OLS结果,但要加一条注释,说明你用了两种方法而且得到的分析结果相似。当然,如果两个结果的差别足以影响结论,那么应该选择序次logit模型而非OLS模型,因为它的约束性不强;也就是说,因为它并不假设类别之间是等距的。
1702650144
1702650145
表14-5 1998年美国成年人政治党派认同的常规最小二乘回归模型的效应参数
1702650146
1702650147
1702650148
1702650149
1702650150
1702650151
1702650152
1702650154
量化数据分析:通过社会研究检验想法 针对删失因变量的tobit回归(及同类方法)
1702650155
1702650156
我们经常会遇到删失因变量,即记录的值不能反映真正的潜在变量的全部取值。经典的例子是经济学家James Tobin(1958)的研究——这就是tobit回归(tobit regression)这一名称的由来(计量经济学家Arthur Goldberger在介绍“Tobin’s probit”时最先使用了这个词)——在该研究中,如果“占有欲”足够强,人们就会购买某种商品,而“占有欲”是由花在该商品上的钱数来测量的。根据对“占有欲”的这一定义,显然,测量在0这一点上是“删失”的,因为那些没有购买行为的人其“占有欲”被记录为0。但在现实中,这些人当中的一部分人的行为或许很接近购买行为,或许价格再低一点他们就会购买;其他一些人或许根本就不想买,无论价格怎样都不会购买;还有一些人或许在买与不买之间犹豫不决。也就是说,那些“占有欲”被记录为0的人其实在相对“占有欲”上存在差异。
1702650157
1702650158
在许多其他情况下一个潜在变量也会被删失。典型的情况是当许多值低于采取行动的门槛值的时候。例如,婚外恋的次数(Fair,1978),母亲所经历的婴儿死亡次数(Wood and Lovell,1992),不同管辖区内警察所杀的人数(Jacobs and O’Bren,1998),囚犯被从监狱释放后再次被捕的次数(Witte,1980),科学论文的发表数量(Stephan and Levin,1992),一个国家示威游行的次数(Walton and Ragin,1990),年工作小时数(Rosen,1976;Keeley et al.,1978;Quester and Greene,1982)。除此之外,我们还可以设想其他各种情况:没有提供足够多答案的态度变量,最大编码值太低的以分类区间编码的收入变量,之所以会被删失,是因为只对那些经历了事件的人分析在事件发生之前所经历的时间长短(Daula,Smith,and Nord,1990)。其他应用实例包括Mare和Chen(1986),Saltzman(1987),Roncek(1992)以及Treno、Alaniz和Gruenewald(2000)。
1702650159
1702650160
JAMES TOBIN(1918~2002),诺贝尔经济学奖得主(1981年),在社会科学界(而不是经济学界)作为“Tobit模型”(该模型是一种估计删失因变量模型的方法)的创始人而知名。但是,他荣获诺贝尔奖所做的主要工作是对金融市场及其与消费和投资决策、就业、生产和价格之间关系的分析。他对家庭和公司如何在实际生活中决定他们资产构成的分析做出了重大贡献,发展了著名的“资产组合选择理论”。其研究结果是对经济中金融市场和流量的描述与分析。
1702650161
1702650162
Tobin在伊利诺伊州尚佩恩(Champaign,Illinois)的一个开明家庭中长大。他的父亲是一名记者,是伊利诺伊大学运动项目的推广负责人;他的母亲是一名社会工作者。他参加了那所大学开设的高中实验课程,正如他在诺贝尔颁奖典礼的演讲中所说,他是1932年总统选举民意测验投票中那里唯一一个把票投给罗斯福的人。他本科和研究生期间都在哈佛大学学习经济学,并于1947年获得博士学位,其间他曾中断过研究生学习,先是在华盛顿找到了一份工作,然后在海军服役,任驱逐舰军官。他曾获得为期三年的“哈佛年轻学者奖励”(一个极富声望的奖学金),其间他用部分时间学习战争期间错过的计量经济学的新进展,之后在耶鲁度过其学术生涯。
1702650163
1702650164
Tobit模型
1702650165
1702650166
显然,问题在于当观测值存在删失情况时我们该怎么办。例如,当我们认为观测值0(或其他某些常数)所对应的真实潜在值其实存在变异时,观测值在0这一点上就是删失的。一种解决方法是简单地对整个数据集运行OLS回归。但是,这会产生不一致的估计值(Long,1997:188-190)。另一种解决方法是舍弃删失样本后,对无删失样本进行OLS估计。例如,在至少工作一定小时数的人中考察他们工作时数的决定因素。但是,此方法意味着对分布做了删截(truncate),这也会产生不一致的估计值(Long,1997:188-190)。Tobin的解决方法是将观测分成两组:无删失观测和有删失观测。对于在某τ值处存在删失的因变量Y的观测值,我们有下面的表达式:
1702650167
1702650168
1702650169
1702650170
1702650171
也就是说,如果Y的“真实”值Y*大于删失值,Y的观测值就等于其真实值Y*;如果真实值Y*等于或小于删失值,Y的观测值就等于某一常数(该常数通常就是删失值,但也不一定如此)。对于(表达式中的)第一组观测,用与常规最小二乘估计同样的方法得到估计值。对于第二组观测,可以先按自变量的取值来估计观测发生删失的概率,然后用此概率来估计似然值。最后基于自变量的取值将这些估计值结合起来以得到所有观测的期望值:
1702650172
1702650173
E(Yi|Xi)=[Pr(uncensored|Xi)×E(Yi|Yi>τ,Xi)]+[Pr(censored|Xi)×τY] (14.13)
1702650174
1702650175
这里,
1702650176
1702650177
1702650178
1702650179
[
上一页 ]
[ :1.70265013e+09 ]
[
下一页 ]