抽样方法

通过 星期五,12月14日,二千零一十八

统计学,一人口是要分析的完整数据集。人口可能由人组成(例如居住在特定城市的人,或生物(例如所有座头鲸的数量,但可以是任何一组具有共同点的对象(例如24小时内在特定道路上行驶的所有汽车)。通常,分析一个完整的人口是不可能的。为什么?

  • 要花太长时间
  • 那太贵了
  • 找不到一个群体的所有成员

所以我们选择样品它代表了人口,并分析了这一点,使用统计技术来推断整个人群的结果。取样很简单;但如何使其真正具有代表性呢?有各种方法。

简单随机样本:在一个简单的随机样本中,每一个人口成员都必须有平等的机会被选中。在这种情况下,所有可能的简单随机样本(特定大小)都同样有可能被选中。但是如果你考虑一个人口,很难确保每个人都有平等的被选中的机会。你不能从电话簿中随机选择号码,因为很多人不在电话簿中。你不能随便选择街上的人,因为你会想念那些在工作的人。创建真正随机样本的一种方法是为每个人口成员分配一个数字,然后使用一个随机数生成器(或者只是从一个框中挑选数字!)创建示例。

简单随机样本对大样本来说不是很有用,地理分布的人口,但是为一个小团体工作,比如学校里所有的学生。

系统样本:如果您可以创建一个有序的总体列表,那么一个系统的示例是有效的。然后您可以选择,说,清单上每十个项目。如果,例如,你有4000人的名单,你想要50个样本,你列出所有人的名单,然后选择每80个名字。但也有可能引入偏见。假设你想对100多年来的月降雨量数据进行一些分析;如果你选择每十二个值,你将连续几年获得同一个月的数据。

分层样本:分析涉及人口分组的数据可能很重要。例如,在对一所学校的学生进行态度调查时,您可能希望看到男孩和女孩的单独结果。如果学校有420个男生和480个女生,你想要一个45号的样品,那么样本应该包括21个男孩和24个女孩。然后,选择过程可以是简单的随机过程,也可以是系统的分组过程。根据需要,分层样本可用于尽可能多的人口子群体。在我们的例子中,您可以将样本进一步细分为年份组。

配额样本:你可能在街上碰到一个研究员,让被选中的人回答一些问题。研究人员正在使用配额样本,通常选择具有特定特征的人,直到达到一个配额(大约30个受访者)。这种方法的缺点是样本不会是随机的,还有一种选择偏见的可能性——研究人员可能倾向于看起来更平易近人的人,例如;但是配额抽样很便宜,简单快捷。

聚类样本:集群是人口的一个子群体,尽可能地,包含了整个人口的所有特征。一旦人口被划分为多个集群,然后对一个或多个集群进行全面分析。缺点是产生的样本不是随机的。然而,集群抽样在地理环境中特别有用。例如,假设你想分析一个国家所有高中生的学业成绩。从每一所学校中选一个来代替是太贵了,将国家划分为城市(集群),然后通过简单或系统的抽样选择一个或多个集群。然后,城市,这些学校形成了进一步的集群:你可以分析一个城市所有学生的结果,或者选择你所选择的城市的学校样本。

还没有评论。

留下答复

您的电子邮件地址将不会发布。已标记必需字段*


*