打字猴:1.702647007e+09
1702647007 量化数据分析:通过社会研究检验想法 [:1702644764]
1702647008 量化数据分析:通过社会研究检验想法 本章小结
1702647009
1702647010 在本章,通过中国识字水平决定因素的具体例子,你们学习了如何进行多元回归和相关分析,以及如何解释所得到的系数。然后,用一个分析接受堕胎的态度的具体例子,我们集中讨论了虚拟变量(一组代表分类变量的二分变量)的处理,特别是虚拟变量与其他变量之间的交互作用。作为被经典统计推论所使用的传统拟合优度测量之外可供选择的方法,我们也介绍了如何使用拟合优度测量BIC。使用这些工具,我们探索了一种组间比较方法,它能使我们决定某一特别的社会过程是否在不同组间相似(例如,基于种族、宗教信仰、性别等的分组)。最后,我们尝试用一个独立数据集来验证结果的有效性,并以使用一套重复截面调查的GSS数据为例了解如何操作。
1702647011
1702647012 为了提高它们的灵活性及探索社会科学中实际问题的准确性,我们在下一章介绍设定多元回归方程的各类方法。
1702647013
1702647014
1702647015
1702647016
1702647017 量化数据分析:通过社会研究检验想法 [:1702644765]
1702647018 量化数据分析:通过社会研究检验想法 第7章 多元回归技巧:处理特殊分析问题的技术
1702647019
1702647020 量化数据分析:通过社会研究检验想法 [:1702644766]
1702647021 本章内容
1702647022
1702647023 本章介绍社会研究者在多元回归框架中处理所面对的具体分析问题时所用的各种“技巧”。本章所有实际例子的Stata-do-和-log-文件都可从网上获得。说具体些,我们将介绍因变量和自变量的非线性转换,检验方程中系数是否相等的方法,以一项趋势分析为例介绍如何评估某一关系的线性假设是否成立,如何构建和解释反映斜率突然变化的线性样条,表示虚拟变量系数的不同方法,以及分解两个均值差异的方法。
1702647024
1702647025
1702647026
1702647027
1702647028 量化数据分析:通过社会研究检验想法 [:1702644767]
1702647029 量化数据分析:通过社会研究检验想法 非线性变换
1702647030
1702647031 在做回归分析时,我们经常有理由怀疑某些特殊的自变量与因变量之间的关系是非线性的。此时,对自变量与因变量之间的关系进行线性估计将不能很好地反映研究样本中的关系。你们已经在第5章的图5-4(c)中见过这一实例,它显示两个变量之间存在一种完美的抛物线关系,但是当我们用线性方程估计时,得到的斜率和相关系数为0。幸运的是,有一个解决此类问题的简单方法——你们可以将一个或多个变量进行变换,使得因变量与自变量之间呈线性函数关系。这里有几个例子,我同时给出一些解释技巧。
1702647032
1702647033 曲线关系:年龄和收入
1702647034
1702647035 在截面数据中,收入通常随年龄增长到中年的某一个峰值,随后开始下降。表示这种曲线关系的一种合理方法是估计下面形式的方程:
1702647036
1702647037
1702647038
1702647039
1702647040 这里,Y=年收入,A=年龄,A2=A×A。
1702647041
1702647042 在2004年综合社会调查(GSS)中,此方程的估计值为(对年龄在20~64岁并有个人收入信息的样本进行估计;N=1573;将最上端的开放区间——年收入为110000美元或以上——编码为150000美元;将其余的收入区间重新编码为它们的中间值):
1702647043
1702647044
1702647045
1702647046
1702647047 可以将其表示为图7-1的形式。
1702647048
1702647049
1702647050
1702647051
1702647052 图7-1 美国20~64岁成年人2003年收入和2004年年龄之间的关系(N=1573)
1702647053
1702647054 为什么收入和年龄之间的关系呈曲线 关于收入和年龄之间的曲线关系有几种解释,其中主要的两种如下:
1702647055
1702647056 ·经济学家主张生产力随年龄增长到某一点后下降;社会学家有时候持类似的观点,但又指出各种制度性因素(例如年龄较大的工人失业后再找工作面临更大的困难)也会导致我们观察到同样的模式。
[ 上一页 ]  [ :1.702647007e+09 ]  [ 下一页 ]