编辑推荐
“万卷方法”的受众
图书馆及大学社会科学各院系的资料室
社会科学工作者各领域的研究人员
社会科学工作者各学科研究方法课程的教学人员
社会科学工作者各专业的研究生和本科生
内容简介
本书所介绍的样本设计的思路,为我们提供了在整个研究过程中如何在若干备择设计方案中进行抉择的基础。我们将这一思路称之为实用抽样设计方法。我们之所以使用“实用”一词是因为我们为读者介绍的框架,强调的是各种可供我们选择的方案和如何在这些备择方案中进行选择的操作要领而非抽样的理论。本书将在概念上对这样的框架进行阐述的同时,还辅之以来自实际的抽样实践的详尽实例。虽然本书并不打算多地从理论和数学的角度来介绍抽样问题,但它介绍的内容都以以往的理论和数学的抽样著作为基础,而这些著作将为那些有志于对这方面文献作更深入了解的读者提供了一个完整的参考书目。
本书的主要阅读对象是那些将抽样作为自己的研究工具的研究人员。同样,本书也可作为社会和政策科学的本科生的方法课的补充教材,以帮助那些有志于从事研究工作的学生学习有关抽样的知识。除上述两个用途之外,本书也可用作那些在计划自己的研究项目时,在抽样方面需要一些咨询的研究人员的参考书。而那些计划进行抽取大的、复杂的样本的研究人员,则最好去寻求有经验的抽样专家的帮助。
作者简介
加里·T.亨利(Gary T.Henry) 在美国弗吉尼亚大学公共管理学教授研究方法、统计学、项目评估和政策分析等课程。曾担任弗吉尼亚公立学校教学评估指标体系研究的项目负责人和中国某大学统计学客座教授。此外,他也是国家议会全国会议的成员和演讲人。
早年在威斯康星大学取得博士学位之后,他进入了弗吉尼亚审计和评审委员会,在那里担任首席方法专家,用定量方法进行教育、惩处和交通问题的研究。随后在州内阁担任教育部副部长。他的研究兴趣涉及稳健估计、实地因果关系评估和公正评测等方面。亨利博士是《评估评论》(Evaluation Review)和《公共管理评论》(Public.Administration Review)等杂志的非常活跃的撰稿人和评审人。他也是美国评估协会规范和道德委员会的主席。
沈崇麟中国社会科学院社会学研究所研究员,中国社会科学院研究生院教授,“第二、三、四批百县市国情调查问卷调查”、“中国城乡居民生活调查”、“中国城乡家庭变迁调查”和“中国城乡社会变迁调查”等研究项目主持人。
内页插图
目录
第1章导论
定义样本
抽样和效度
为什么要抽样
本书概要
第2章样本选择方法
非概率抽样
非概率样本的用途
概率抽样
结论
第3章实用样本设计法
抽样设计中的误差源
实用抽样设计的框架
抽样前抉择
研究的性质究竟是什么——探索性的、描述性的还是分析性的
最感兴趣的变量是什么
研究的目标总体是什么
某些子总体或特定的群体是否对研究很重要
用什么样的方法收集数据
是否宜于抽样
抽样抉择
什么样的目标总体清单可作为抽样框使用
可容忍的误差或估计的效应的大小是多少
采用什么类型的抽样技术
选择的概率是相等的还是不等的
选人样本的单位是多少
抽样后抉择
如何评估无回答问题的影响
样本数据是否需要加权
研究变量的标准误差是什么
小结
第4章实用样本设计的四个实例
劫匕卡罗莱纳州居民调查
抽样前抉择
抽样抉择
抽样后抉择
佛罗里达高龄老人调查
抽样前抉择
抽样抉择
抽样后抉择
弗吉尼亚出院精神病人调查
抽样前抉择
抽样抉择
抽样后抉择
调查研究中心的美国本土住户样本
抽样前抉择
抽样抉择
抽样后抉掸
小结
第5章抽样框
一般总体的抽样框
特殊总体的抽样框
总误差和抽样框
结论
第6章抽样方法
简单随机抽样
系统抽样
分层抽样
整群抽样
多级抽样
小结
第7章样本容量
高效样本的容量
样本容量设计的实质
子总体分析
不合格和无问答的修正
费用
信度
小总体抽样
小结
第8章抽样后选择
权的使用
无回答评估
陈述数据
结论
参考文献
精彩书摘
第二章 样本选择方法
样本选择方法可归结为两类:概率抽样和非概率抽样。概率样本是以这样的方式,即总体的每一成员实际上都有一个被选人样本的概率选取的。非概率样本的选取都基于研究者的主观判断。研究者一般都以手头进行的研究所要达到的特定目标作为判断的依据。本书主要介绍概率抽样。其原因在于概率样本使我们能对它们进行严格的统计分析,从而确定可能的偏倚和误差。非概率样本则不具备类似的优点。但是在某些场合,非概率样本也不失为一种颇为有用的工具。
非概率抽样
很多研究项目都使用非概率样本。这些样本可以方便地或以某种系统的标准为根据选取。非概率样本实际上是一组性质各异,用主观判断选择的样本的抽样方法的总称。这些方法在确定将总体中的哪些单位选人样本时,都以主观判断为准。非概率样本的选择方法与概率样本的不同,后者都采用基于某种随机机制的选择方法,以确保样本的选择能独立于主观判断。
常用的非概率样本设计有以下六种:
?方便样本(Conveniences samples)
?最相似/最不相似样本(Most similar/most dissimilar samples)
?典型个案样本(Typical case samples)
?关键个案样本(Critical case samples)
?滚雪球样本(Snowball samples)
?配额样本(Quota samples)
方便抽样。方便样本是由一组乐于接受调查的个人组成的样本。例如,对电影中的暴力和美国民众的攻击性行为这两者之间的关系感兴趣的心理学家,可以在实验中使用一些来自选修心理学导论课的学生的志愿者作为实验对象。学生首先自愿报告他们自己对暴力问题的态度、倾向,再对他们在一个人为编排的冲突场景中的作为进行观察。随后我们用随机分配法(random assignment)将学生分成两个组。随机分配法是一种用来将自愿参加实验的学生分为一个实验组(treatment group)和控制组(control group)的专门技术。它不同于随机抽样。随机抽样是一种关乎整个样本,即两个组的所有成员的选择的概率方法。我们在本例中使用的方便样本不是随机抽样。在事后将样本分为两个组的时候,譬如像本例那样,我们应该使用随机分配法。
一组成员被示以有暴力画面的电影,另一组放映的电影则没有暴力画面。随后我们对两组的成员进行访谈,再观察他们在可能有暴力冲突的场景中的言行。然后对两组成员在电影放映前后的态度和行为的差异进行比较。
参与这一实验的学生便是一个方便样本。他们是一个现存的群体的一部分,研究者很方便从这一群体中获取志愿者。获取数据的方便性只是研究者诸多目的中的一个目的。研究的主要目的还在于了解暴力电影对美国民众的影响。但从这样的样本得到的数据究竟能使我们对这一问题有多少了解,则另当别论。
除了暴力电影揭示的因素之外,在理论上讲,还可能存在其他滋长暴力倾向的因素。这些其他的因素是一些混淆变量(confoundingvariable)。这些变量使我们难以确定自变量(independent variable)(本例中的暴力电影)的影响。例如,个人在精神或情感上的压抑程度可能被假设与暴力倾向有关。不仅如此,年轻人性格可能比较外向,因而更易具有暴力倾向。
在这个意义上讲,样本中的所有学生(包括实验组和控制组)较美国的成年人口总体的压抑程度不是更高,就是更低。就存在于实验组和控制组的攻击性行为的差异而言,乐抑程度同样也可能是一个混淆变量。如果学生的压抑程度低于成年人口总体,那么我们实验得出的暴力电影不会使暴力倾向有所增长的结论,并不适用于成年人口总体。这样的设计的主要问题在于在问题涉及压抑程度时,使用这样的样本作为总体的模型是不够精确的。不仅如此,这样的样本也无法了解其他假设的可能引发暴力行为的因素。因此,我们无法断定暴力电影的影响(或没有影响)这样的结论是否适用于样本之外的场合。
在本例中,年龄是一个更易观察到的混淆因素。大专院校的学生年龄大多数在18到25岁之间。如果年轻的成年人更倾向于暴力行为的话,那么样本就可能有偏向更高的侵略性行为的偏倚。选择如本例所示的方便样本,可能会使结果有偏倚,因而使我们无法将得出的结论推广到总体。不言而喻,其他因素也可能对暴力态度和行为有所影响,而这些因素在样本和总体之间的分布是不均衡的。
不确定性和偏倚可以有两种方法加以控制:一种方法是使用更多的数据,对方便样本加以改进;另一种方法是放弃使用方便样本,改而使用概率样本。首先,对那些易于量度的特征,如年龄,我们可以直接加以控制。一个可供我们选择的方便样本是比例代表样本,即按每一年龄组的比例(但可能不是从一个心理学班)来分配和选择样本成员。
我们难以得到有关总体的压抑程度方面的信息。而这些信息对于分组和按比例地选择个体都是必不可少的。随机选择可以确保总体的每一成员都有被选人样本的可能,给我们提供了一个控制压抑程度的量度。随机选择是一种隐含的控制,用来得到多种特征,包括压抑程度和其他尚未直接控制的特征的混合体。随机选择,作为概率抽样的一个重要性质我们将在以下节进行介绍。
我们有必要花费一点时间给大家介绍一下本例中将学生随机地分配给实验组和控制组的问题,以使大家对与内部效度(internal va—li(tity)有关的选择偏倚有所了解(Cook&Campbell;,1979)。这就是说,实验组和控制组(二者均由来自该校心理学选修班的学生组成)之问的在侵略性行为上存在的差异可归结为暴力电影的影响。随机分配的目的在于去除那些任何其他也许可以解释存在于志愿者身上的差异的变量。然而随机分配并不能解决在将从样本数据发现的效应外推到美国公众时,可能发生的不确定性和偏倚的问题。在本例中,由于方便样本的使用,使我们对样本的发现的概括受到了很大限制。
有关无家可归者人口和非机构(deinstitutionalization,指20世纪末发生在美国社会中将精神病患者从公立医院转到社区医疗服务中心的趋势,译者注)问题的文献为我们提供了一个采用方便样本的具体例子。随着政策制定者对无家可归者问题的严重性认识的深入,他们也越来越急需我们能为他们提供有关的经验数据。这就意味着更多的数据将使用方便样本收集(Burnam&Koegel;,1988)。通常教堂和其他各种为无家可归者提供床位的场所都是我们用来选择调查对象和收集数据的地方。因为有关什么样的人才可以得到床位的规定将某些人排除在了样本之外,所以这样的样本可能存在某些偏倚。此外,某些无家可归者并不愿意,或不能通过得到一张床位所要求的手续。
近年来,有两个有关无家可归者的研究,试图为我们提供一些基于概率样本的信息。罗西、赖特、费希尔和威利斯(Rossi,wright,Fisher,and Willis,1987),以及伯纳姆和考杰(Bumam&Koegel;,1988)描述的方法,虽然比方便样本需要更多的时间和预算,但是他们的发现确实与以前的调查有所不同。例如,伯纳姆和考杰发现只有不到一半(44.2%)的无家可归者在教堂或收容所的床上过夜,而基于方便样本的这一数字几乎为三分之二(66%)。二者存在明显的差异。
最相似/最不相似个案抽样。最相似/最不相似样本由立意样本(purposeful sample)变化而来,多用于比较性的政体研究和政策取向的个案研究。为了比较政治、社会和经济体系之间的关系,西方国家,如美国、加拿大、英国、法国、德国和意大利经常被组合在一起作为一个国家的样本。其他的组合,例如发展中国家组合,则常被用来进行诸如国家债务的增加对国家的生活水平的影响这样的研究。在最不相似设计中,为了对政策的实施结果进行比较,个案研究经常选择“最好”和“最坏”的个案。
如果个案和资源都比较有限,而所需的信息主要用来进行比较,这些研究是很有用的,但是问题在于,由这样的研究得到的结论能否推广到个案研究的范围之外。在考虑财产税率或断定州资助是否适当时,一个地区常常需要将自己与相邻的地区进行比较。在这种情况中,地理上的邻近程度是相似性的操作定义。这些比较既可能,也可能不太精确地刻画那些在课税基数或提高地方收入能力相似的地区的相对位置。
典型个案抽样。在时间和资源极度不足时,我们也常常会改而选取非概率的样本。“典型个案”设计便是在遇有这样的情况时采用的抽样设计。在采用这样的抽样设计时,研究者选取为数不多的几个、他们认为是正常的或一般的个案。为了提高设计的信度,那些看做独特的或特殊的个案都不会被选人样本。
在这样的设计中,研究者本人对总体的判断和了解对于样本的信度是至关重要的。在政策研究中,“典型个案”样本的选取常常需要进行非常严密的详细审查。对选择偏倚的疑虑是这样的样本存在的一个普遍的问题。使用“典型个案”会引起人们对选取的个案进行详细的审视,而在人们感到个案并非那么典型时,我们发现的那些信度就会因此而大为减色。这样一种类型的设计的个案选择法,其注意力主要集中在每一单独的个案上。样本变成了审视的焦点。
关键个案抽样。另一种在许多方面都与“典型个案”设计颇为相似的非概率样本设计是“关键个案”设计。在关键个案设计中,研究者选择了数目有限的几个个案,这些个案在逻辑上或依据以往的经验允许我们进行总体的推论。为了预测大选的结果,我们可以关键个案的逻辑为依据来选择关键的选区。在美国社会几乎是家喻户晓的格言“缅因在握,美国在握”(As Maine goes,SO goes the nation),便是这一设计应用的极端例证。在1948年前的美国大选中,用缅因州的选举结果来预测全美的选举结果是非常灵验的。1948年的大选中,缅因州的选民大多数都把票投给了杜威(Dewey)。于是有人喊出了这样的口号“见缅因而知佛蒙特”(As Maine goes.so goes Ver—mont)。
滚雪球抽样。与其他非概率样本显著不同的非概率样本是滚雪球样本。滚雪球抽样借助先前确定的一组成员来确定总体中的其他成员。随着新近确定的成员不断列举其他的成员,样本如同滚雪球一般逐渐成长壮大。滚雪球抽样多用于不存在总体的清单,且研究者也无法自行编撰诸如这样的清单时。有关各种不同的群体,如非法侨民和社区“权力精英”的社会学研究常采用这种方法来生成总体的样本。
配额抽样。另一种非概率抽样得到的样本是配额样本。配额样本将我们研究的总体的群体分为子群体,例如分为男性和女性,或白人、西班牙裔、美国印第安人和其他少数民族等。然后,根据在最终的样本中所需的子群体的比例;分配给调查员既定的、需要他们选取和调查的每一子群体的样本单元数。配额样本与概率样本,特别是与分层样本有许多相似之处,但是它们在一个重要的方面却不尽相同。配额样本允许调查员在选取样本个体时做主观判断。我们给调查员以明确的指示,告诉他们我们希望应选作调查对象的特征。例如,我们可能告诉调查员,在某一邻里地区选取的被调查人数,其中自人和黑人各多少,或在分配好的额度中,男性和女性各多少。在通常情况下,确定的各个子群体的数目将使整个样本中各子群体所占比例与总体相同。
但是我们必须要指出的是,配额样本的被调查人是由调查员选择的。斯图加特(Stuart,1984)指出,配额样本可能会引起三种问题:
正如我们将要从这样一种调查员的自由所证明的那样,在群体抽样中,总是存在着发生选择的偏倚的危险,因为在这样一种抽样中,选择程序的定义并不是十分明确的。至今我们仍然没有可以用于估计这样的样本的标准误差的有效方法……配额抽样隐瞒了这样那样的无回答问题。(黑体系原作第43页所强调的要点)
我们之所以说配额抽样隐瞒了无回答问题,是因为每当调查员在遇有拒绝接受调查的被调查人,或找不到户中的任何人的时候,只是简单地选另外一户进行调查而已。因而调查员总是可以得到要求的调查数,但是总体中那些难于联系到的被调查人的比例却可能会因此而被低估。
库克和坎贝尔建议采用一种特殊的配额抽样法。他们把这种方法叫做“异质详析抽样模型”(the model of deliberate sampling for het—erogeneity)(Cook&Campbell,1979)。他们提出的这种配额抽样策略,要求我们从各种各样可能对调查结果有影响的背景和条件中来选取样本成员。“因此一个综合性的教育实验设计,必须包括来自城市、小镇和农村地区的不同家庭背景的,在天资和价值观上存在很大差异的男孩和女孩。”(Cook&Campbell;,1979,P.75)而这样一种设计的不足之处在于它难以用来进行归纳概括。研究者至多只可以说“至少从一个样本来看,影响是存在的(或不存在的)”(Cook&Campbell;,1979,P.76)。虽然在这样一个层次上,我们的陈述可被认为是正确的,但是用一个不同的样本,某些混淆变量(confoundingvariables)有可能使我们的发现不复存在。不了解样本的前提条件,配额抽样对于理论构建的用处是很有限的。此外,将发现限于某一个特定的样本的做法,会使我们提供的信息对于政策所产生的影响变得十分有限。
鉴于上述理由,配额样本作为一种抽样方法,并不为我们看好。尽管如此,我们一直还在使用配额抽样,因为在通常情况下,它的费用比概率样本低。在以户为基本研究单位的研究中,我们有时会使用一种与配额样本多少有些相似,但实际上却是一种概率样本的抽样方法。带有配额的概率样本要求调查员在特定的地理位置,按照特定的路线,对配额规定的数目的被调查人进行调查。
苏德曼对我们之所以将这样一种抽样形式看做一种概率抽样的根据做了简要的阐述:
配额概率样本的基本假设是,被调查人是可以进行分层的,且层中宜于进行调查的概率是已知的……任何一个被调查人被调查的概率等于他最初被选到的概率与他的宜于进行调查的概率的积。(Sudman,1976,P.193)
然而,配额概率抽样是一种有偏的抽样方法,尽管这种偏倚一般不算太大。此外,它的抽样误差也高于同样容量的其他概率样本(Hess,1985)。
非概率样本的用途
在某些场合非概率样本是一种有用和便于进行调查的抽样方法。在许多情况中,它是一种比较合适的抽样方法,而在某些时候,它是唯一可以使用的抽样方法。例如在某些特定人口总体,如非法使用毒品的人口总体的研究中,我们不可能得到抽取概率样本所需的清单。用于滚雪球式抽样的列举法可能是唯一可行的抽样方法。
在研究者的确对人口总体中的特定成员感兴趣的时候,用这些特定成员而非整个人口总体中的所有成员来构成样本时,采用非概率样本也许也比较恰当。例如,某些比较性的政府研究更感兴趣的是某些特定的国家,而非国家的分组(如发展中的债务国)。
实用抽样方法 epub pdf mobi txt 电子书 下载 2024
实用抽样方法 下载 epub mobi pdf txt 电子书 2024