抽样技术
统计学的分支学科
抽样技术(Sampling techniques)是统计学分支学科,主要研究从总体中抽取样本的方法及基于样本推断总体参数的估计技术,可分为概率抽样(如简单随机抽样分层抽样)和非概率抽样两大类。其核心内容包括常用估计方法有简单估计、比估计和回归估计等。
基本概念
样本
样本单位:样本单位常根据样本性状来确定。
样本容量:样本容量是指样本中含有多少个取样单位。从理论上讲,如果其它条件相同,样本内的取样单位越多,则由样本所估计的值越准确,误差越小,代表性越大。若样本容量太小,则得不到准确的结论。但样本容量太大,势必大大增加工作量,造成不必要的浪费。为了保证取样的准确,并不使工作量太大,一般取最小的样本容量。
目标总体和抽样总体
在抽样技术里,有着两个相互联系又各具有其不同意义的总体概念,即目标总体和抽样总体。
目标总体(the target population)是指所要了解和研究的客观对象的全体构成的集合。目标总体是客观存在的现实,所以也称为客观总体。构成目标总体的个体称为总体单位(population units)。
抽样总体(thesamp ling population)是指从中抽取样本进行数据采集的具体对象的全体构成的集合,抽样总体由已经搜集的数据构成,抽样总体是对客观存在的现实映射。构成抽样总体的个体称为抽样单位(sampling units)。
估计
从总体中随机抽取样本的目的就是为了对总体标志进行估计。对所随机抽取的样本单元进行现场调查,获得样本观察值,按照估计量的计算公式,计算估计量的观察值,并作为总体标志的估计值,这个过程称为估计。利用概率抽样的样本,估计总体标志的统计量为估计量。估计量也是样本统计量
总体标志估计结果的评价不是依据样本的一个观察值,而是基于样本所有可能观察值的平均水平。总体标志估计结果的常用评价标准有无偏性有效性和最小均方误差。
系统性偏误
当抽样单位与总体单位一一对应时,抽样总体与目标总体之间具有完整的一致性;若抽样单位与总体单位存在差别,就意味着抽样总体和目标总体存在差别,这时通过抽样所得到的数据推断的总体参数就必然存在偏误,这种偏误为系统性偏误。
系统性偏误(systematic bias)是指与抽样的随机性误差无关的,不会随着抽样的样本容量增大而减小的常数项偏误。例如,当人们采用陈旧的,事过境迁的数据构成抽样总体,或者采用使用时间久远的样本进行数据采集,或者采用街头或网上随意样本进行调查,或者采用含有较多无回答问题的样本进行参数估计,就会导致系统性偏误。当抽样数据含有系统性偏误时,需要采用抽样理论中各种纠偏方法,利用有关辅助数据来加以修正,例如可以采用抽样后分层技术,回归估计技术等。抽样总体的设计和系统性偏误的纠偏是现代抽样技术的重要组成部分。
抽样框
抽样框(sampling frame)是按照抽样的目的和抽样方法的要求,为了实施样本的抽取而专门构造的,对抽样总体数据进行编码和排序,所构成的有序的数据库。
第一,构造抽样框的前提是必须从统计研究和抽样目的出发。
第二,构造一个有效的抽样框,要与具体抽样设计中所采取的抽样技术相适应。例如,我们要根据分层抽样、整群抽样、多阶段抽样等不同的抽样方法,以及抽样后分层技术,回归估计技术等数据处理和参数估计方法的具体特点和要求来科学地构造抽样框。
第三,构造一一个有效的抽样框的基础是拥有能够如实反映目标总体现实状况的抽样总体数据。在已掌握的抽样总体与目标总体存在较大差异时,则需要及时进行有关的全面调查,搜集新鲜的全面资料,为构造有效的抽样框提供目标总体的真实数据。在无法立即进行全面调查时,可以采用二二相抽样方法,利用第一相抽样资料来构造抽样框。消除由此造成的系统性偏误。
第四,在构造抽样框,还要防止在采取系统抽样方法时,发生抽样的频率与抽样框资料中样本单位的调查标志的变动周期恰好吻合的现象,避免由此而引起的系统性偏误。在抽样技术中,抽样总体和目标总体存在差别而产生系统性偏误,往往通过抽样框有偏的形式反映出来。通常将这种由于抽样总体和目标总体存在差别而产生系统性偏误,以及构造抽样框过程中由于其他失误新产生的系统性偏误统称为“抽样框偏误”。
从抽样框抽取部分的抽样单位的观测值所构成的集合称为样本(sample),根据样本计算的统计量推断总体参数时产生的随机误差,称为抽样平均误差。抽样平均误差(sampling error)是样本统计量与总体参数真值之间误差的测度,通常用样本估计量的标准差来度量,一般也简称为抽样误差。样本估计量的标准差反映了使用样本数据来推断总体参数时,统计量与总体参数真值之间误差的平均水平。
抽样方法
顺序抽样
顺序抽样也称机械抽样或系统抽样。按照某种既定的顺序抽取一定数量的单位组成样本,例如按总体各单位编号,或逢1或逢5等距抽样,或间隔一定数量依次抽样,或按照行次每隔一定行数抽取一个抽样单位,或在同一方向位置抽样。这种抽样方法简便,当抽样单位在总体内分布均匀时,能够得到比较准确的结果。如表1所示。
简单随机抽样法
简单随机抽样法也称单纯随机抽样法。一般先对总体各试验区进行编号,然后用抽签或随机数字表来抽取所需数量的抽样单位组成样本,这能使总体内各单位被抽取的机会均等,从而能够提高由样本所计算估计值的可靠程度。应用这种方法,对于变异较大的总体进行抽样,可得到较为可靠的总体估计值;如果总体变异太大,表现明显的部分差异则往往有偏性。
典型抽样
典型抽样按调查研究的目的要求,从总体内有意识地选取一定数量的有代表性的典型抽样单位,加以测定,至少要求所选取的单位能够代表总体的大多数。这种抽样方法,比较容易说明问题,但常容易丧失随机抽样的作用,所得的数据不适用统计分析。
划区抽样法
划区抽样法或称分层抽样法、类型抽样法。先从总体内用典型抽样法选取典型单位群,然后在各部分中进行随机抽样或顺序抽样,再根据各部分样本数值计算总体的估计值。
带状抽样法
带状抽样法是指有的试验需要群体影响作为抽样标准,需要划分若干抽样带。随机选取带状的产品群体作为代表,相互比较。
参考资料
最新修订时间:2025-10-06 02:56
目录
概述
基本概念
参考资料