打字猴:1.70264799e+09
1702647990
1702647991 一旦编制好住户列表,我们就可以随机抽取部分住宅,并派出访问员进行访谈。接下来的问题是如何在家庭户中随机选取一人或多人进行访问。这一过程由访问员完成。他们先列出家庭户中符合调查条件的所有居民,并根据Kish表(以抽样统计学家Leslie Kish的名字命名)或其他类似方法〔见Gaziano(2005)对家庭户内的受访者进行抽样的方法的讨论〕随机抽取一人(或多人,根据研究设计决定)。例如,假设访问员被告知去访问一位年龄介于18~69岁之间的人,则他应列出家庭户内所有符合年龄条件的成员,并参照随机数表或其他工具选取一人,如选取其生日与访问日期最接近的人。
1702647992
1702647993 家庭户样本的优势在于能够代表实际人口,即那些居住在某地的人口。但同时它们有三点重要的不足。家庭户样本的第一点不足是,访问中的作弊行为较易发生,比如访问员可以选择那些碰巧有空的人,而不愿在被选定的人没空时,选择下次折返并完成访问。访问员应努力多次(一般三次)以完成访问,实在不行才放弃。我在90年代初在南非做调查时曾发现调查作弊行为,当时我注意到97%的黑人都是在第一次接触时接受访问的——这是一个完全令人难以置信的比例(相对于白人、亚裔和其他有色人种80%的比例)。在数据收集过程中同时建立有关访问过程的信息对发现此类问题至关重要——例如,让访问员记录每次拜访的日期和时间,以及拜访的结果,同时对每个家庭成员都至少收集年龄和性别信息,并将其存入分析数据,从而允许分析者将受访者的分布与所有家庭户成员的分布进行比较。在我所做的南非调查中,通过使用此类信息我发现男性样本不足,因而通过调查机构收集了男性的补充样本。
1702647994
1702647995 家庭户样本的第二点不足在于它们不是真正的人口概率样本,因为相对于小家庭户,生活在大家庭的人口被抽中的概率要小。如2000年,美国有34%的家庭只有一个成年人,而54%的家庭有两个成年人,其他家庭则有三个或更多成年人(GSS数据)。显然,生活在只有一个成年人家庭中的成年人被抽中的机会是有两个成年人家庭中的成年人的两倍。
1702647996
1702647997 我们通常根据家庭户中符合调查条件的人数对数据进行加权,从而将家庭户样本转换成个人样本,并在保持初始样本规模的条件下使样本正常化。这在Stata中是很容易做到的。例如,假设我们的目标总体是所有成年人,因而希望根据各家庭户中的成年人口数量对样本进行修正,那么我们清点每个家庭户中的成年人口。在Stata中,我们只需简单地标识出[pweight=adults](或者根据命令的不同,使用[aweight=adults])。现在假设每户的平均成年人口数是2.0个,则有4个成年人的家庭户的权重为2,而只有一个成年人的家庭户的权重为0.5。同时权重的平均值为1,总和为N,即样本规模。
1702647998
1702647999 碰巧,根据不同的家庭户规模对GSS数据进行加权并不会对大多数变量产生影响,因此对我们在前面章节中用GSS数据所做的分析总体来说并未远远背离其真实结果。但进行这类修正却仍然是十分重要的。在某些情况下,根据家庭户规模所做的修正确实会影响到结果——例如在对家庭收入进行分析时。使用美国2002年的GSS数据,根据家庭户规模进行加权使得我们对家庭收入的估计值增加了约10%(参见下载文件“ch90.do”的第一部分):
1702648000
1702648001 未加权均值=50102美元
1702648002
1702648003 家庭户规模加权后的均值=54880美元
1702648004
1702648005 家庭户样本的第三点不足是我们日益难以保证较高的应答率。当东欧处于社会主义时期时,完成90%以上的访谈是比较普遍的情况;但自社会主义解体后,应答率迅速下降。同样的情况也发生在中国,尽管其应答率曾经超过95%,但却呈稳步下降的趋势。在中国的城市,由于人们越来越多地居住在带门禁的高层建筑中,这种下降情形尤为严重。GSS的应答率一般约为75%,而美国其他调查的应答率则更低,因此我们得到的很可能仅仅是目标总体的一个非随机次级样本。例如在GSS数据中,由于男女应答率的不同,男性样本常常不足(Smith,1979),从而对总体人口所做的任何估计,只要其存在男女差别——例如关于主观态度的题目就是如此——都将是有偏的。
1702648006
1702648007 高级抽样方法 有一种更高级的方法来替代先对家庭户进行列表而后抽样,然后再在被抽中的家庭户中对人口进行列表而后抽样的办法。那就是对每个小型区域进行小规模的普查,拜访每个家庭户,并记录每位居民的年龄、性别及其他特征,然后直接从符合调查条件的个人列表中进行抽样。虽然该方法会显著地增加调查成本,但它远比针对地址列表的抽样准确,因为各家庭户规模差异极大,而且尤其是在那些高密度社区,经常存在一些较隐蔽的家庭户——因而如果没有访问当地居民并询问是否存在此类家庭户,它们就会在样本中被遗漏。
1702648008
1702648009 我们经常使用两种方法来提高应答率:一是抽取比访谈目标更大的样本,从而抵消无应答人数;二是在某个访谈无法完成的时候,由访问员使用一个新样本,通常是用同一区域内的新样本进行替代。这两种方法都可以增加完成的样本量,但却不能克服因潜在应答率的不同而导致的偏差。
1702648010
1702648011 随机移动样本 随机移动样本(random walk samples)是家庭户样本的一种变体。在每个小型区域内,我们要求访问员从某一指定地点开始,(通常是在某个十字路口)向特定方向行进,并选取其遇到的每一个第n个地址(我们甚至可以使用随机数作为不同间隔),并在每个路口都拐入特定的方向。这相当于快速创建了地址列表。但我们并不推崇这种方法,因为它除了具有家庭户样本所固有的那些不足之外,即使在访问员非常诚实的情况下,也将很难发现那些隐蔽的居所。同时,与常见的家庭户抽样相比,在使用这种方法时作假尤其容易,因为列表、抽取和访谈家庭户都是由同一人完成:通常除了那些被实际访问到的人之外,我们很少有关于潜在样本的具体信息。此方法仍被使用的原因在于相比于户籍资料抽样和传统家庭户抽样,其成本较低。在最早两期(1972年和1974年)的GSS调查中就结合使用了随机移动方法和一个配额样本。
1702648012
1702648013 配额样本 在配额样本(quota samples)中,访问员被要求获得一定数量具有某些指定特征人群的相关信息——如40岁以下的女性、40岁及以上的女性、职业女性等。配额方法多与多阶段概率抽样结合在一起使用:我们先用多阶段概率抽样方法选取小区,然后在每个小区内,由访问员进行访问以完成配额。
1702648014
1702648015 配额样本通常并不是一个好办法,因为:首先,它们不满足允许有效统计推断的条件——它们不是任意总体的概率样本。其次,它们产生的只是其想要代表的总体的有偏样本,更多地包含了那些在调查进行时容易接触到的人。再次,严格控制的配额抽样只在使用概率抽样非常困难的情况下才有用,以保证更高的总体覆盖率。
1702648016
1702648017 分层概率样本
1702648018
1702648019 多阶段概率样本有时是分层的,也就是在抽样设计中将各部分总体单独处理。例如,在抽样之初就将城市和农村分开,并分别从这两部分中抽取独立样本。之所以要进行样本分层,其主要原因是为了从每层中都能抽到足够数量的样本以保证分析需要。例如,为了对美国各州的某些现象进行估计,我们需要对全国样本按州分层,否则在那些较小的州,我们可能只会抽到很小的样本,或者根本抽不到任何受访者。使用分层抽样的第二个原因是使整群效应最小化,本章稍后会详细讨论该问题。
1702648020
1702648021 无应答的原因 无应答的主要原因是访问员不能联系到目标家庭户(如在有门禁的社区和高层公寓),或者无人在家,或者户主拒绝接受访问,而无法开始访谈。基于此,高质量的调查通常会通过邮件来试图联系目标家庭户,以解释调查的原因,从而为访问员的入户做好铺垫。在被联系到的家庭户中,相对较少的人会拒绝访问(尽管拒访率在上升,尤其在城市更是如此),而几乎不会有人在访谈开始后要求终止。
1702648022
1702648023
1702648024
1702648025
1702648026 量化数据分析:通过社会研究检验想法 [:1702644783]
1702648027 量化数据分析:通过社会研究检验想法 设计效应
1702648028
1702648029 由于全国性抽样调查一般基于多阶段区域概率样本,因而导致其存在一个问题——那些基于随机抽样假设的标准统计软件倾向于低估数据中的真实抽样误差。其原因在于,当观测值聚类分布(来自几个选择性的抽样点)时,许多变量的群内方差会小于其总体方差。这意味着群间方差——决定了整群分布样本标准误的群均值间方差——远大于同一总体的简单随机样本方差。这类偏小的群内方差,尤其是有些社会人口变量的方差,常常典型地出现在多阶段概率样本的第三层抽样小区域里。例如,各个街区在教育、年龄、种族等特征上常常比整个国家这一总体具有更强的同质性。其结果是,当我们基于简单随机抽样的假设使用统计方法的时候,我们所计算的标准误常常太小。因而我们不仅需要考虑群内个体间的方差,而且也需要考虑群间方差。这正是调查估计(survey estimation)所做的。〔对该方法的详细介绍,尤其是其在Stata中的应用,可参见Eltinge和Sribney(1996)的论文。然而,自这篇论文发表以来,Stata中的调查估计程序已经得到极大的拓展:它们现在能够处理两级以上的多阶段设计,并且对更多的估计程序都有了调查估计版本。〕
1702648030
1702648031 为了说明设计效应(design effects)给标准误带来的影响——考虑到我们处理的是整群样本这一事实——我会以1996年在中国设计全国性抽样调查的过程中所进行的一些抽样实验为例(Treiman et al.,1998)。因为这次调查是将访问员从北京派往各个抽样点,因而出于成本的考虑,我们试图严格控制抽样点的数量。然而,由于中国是一个内部异质性非常强的大国,因而高度整群的样本势必产生我们不可接受的巨大的抽样误差。为了了解整群效应可能产生的潜在问题,我们用1990年1%人口普查样本做了一些分析。
1702648032
1702648033 尽管我们做过多次实验,但此处我只举其中一例来说明整群效应的潜在问题,即一个农村样本的三阶段抽样设计。第一阶段用PPS方法随机抽取50个县,第二阶段同样用PPS方法在每个县内随机抽取2个村,第三阶段在每个村随机抽取30名年龄在20~69岁之间的人。因此该抽样设计将创建一个300人的样本。以同样的方法,我们在城市中抽取相应的样本。为了检验相对于同一总体而言,整群样本是否会产生比随机样本更大的抽样差异,我们计算了几个中国人口特征统计量,并估计每个统计量的设计效应(deff)。设计效应是考虑到使用整群样本所计算的抽样方差与假设使用同样规模的简单随机样本所计算的抽样方差之比,也可被看作是决定样本规模的一个因素。如果设计效应为2,则说明我们需要两倍规模的整群样本才可以获得与简单随机样本同样的标准误(Kish,1965:259)。
1702648034
1702648035 LESLIE KISH(1910~2000) 是20世纪最杰出的调查统计学家之一,其具有开拓意义的专著Survey Sampling(1965)后来成为该领域的标准。他在复杂样本的统计推断方法以及其他应用的发展方面做出了突出贡献(Kish发明了deff和meff统计量)。他还协助建立了密歇根大学调查研究所,并为其设计抽样。
1702648036
1702648037 Kish出生在原属匈牙利的波普拉德(Poprad),该地现属斯洛伐克。1925年,他与家人来到美国,其父不久后去世,他在支持母亲和兄弟姐妹们的生活之余在纽约城市学院的夜校取得了数学学士学位。其间,他还在西班牙作为国际纵队成员参加反法西斯战争两年。取得学士学位后,他前往华盛顿,先后任职于人口普查局和农业部。后来他再次成为志愿兵,这次效力于美国军队。1947年他前往密歇根大学,在那里他不仅协助建立了社会研究院,并担任教职,而且完成了硕士和博士学业。他在密歇根度过了余生。
1702648038
1702648039 我们必须对各个统计量分别估计其设计效应,因为各个统计量的设计效应有可能显著不同。在某些情况下,尤其在样本是分层的时候,设计效应甚至可能降到1以下(即设计样本得到的抽样方差实际上小于随机样本)。
[ 上一页 ]  [ :1.70264799e+09 ]  [ 下一页 ]