样本量:我需要多少调查参与者?


打印

为了确保您的调查结果具有代表性,在您调查的每个小组中拥有大量随机选择的参与者至关重要。那究竟什么是“大数?” 对于95%的置信水平(这意味着只存在你的样本结果的5%的机会从真实总体平均不同的),误差的裕度的良好估计(或置信区间)是通过1 /√给出Ñ,其中N是参与者的数量或样本量(Niles,2006)。

下表显示了样本大小范围为10到10,000的误差范围的估计值。(对于对统计感兴趣的更高级学生,Creative Research Systems网站(Creative Research Systems,2003)有一个更精确的公式,以及一个可以使用的样本量计算器。但是,对于大多数用途,1 /√ N方法就足够了。)

样本量
N
误差范围
(分数)
误差范围
(百分比)
100.31631.6
200.22422.4
500.14114.1
1000.10010.0
2000.0717.1
5000.0454.5
10000.0323.2
20000.0222.2
50000.0141.4
100000.0101.0

您可以从表格中快速查看调查结果,只有10名随机参与者不可靠。在这种情况下,误差幅度约为32%。这意味着,如果你发现,例如,你的10个参与者中有6个(60%)有高度恐惧,那么恐高症的人口的实际比例可能会有±32%的变化。换句话说,实际比例可能低至28%(60 - 32),高达92%(60 + 32)。范围很大,你的小调查并没有多说。

如果将样本量增加到100人,则误差范围降至10%。现在,如果60%的参与者报告了对高度的恐惧,那么总体人口中有50%到70%的人有恐高症的概率为95%。现在你到了某个地方。如果要将误差范围缩小到±5%,则必须调查500个随机选择的参与者。最重要的是,您需要先调查很多人,然后才能开始对结果有信心。

参考书目

  • 此网页计算所需置信区间所需的样本量,或给定样本量的置信区间:
    Creative Research Systems,2003。“样本量计算器”,2006年6月28日检索自 
    http://www.surveysystem.com /sscalc.htm

  • 该网站提供有关统计和统计测试的信息,为非数学家编写:
    Niles,Robert,2006年。“Robert Niles的新闻帮助:每个作家应该知道的统计数据”,RobertNiles.com。2006年6月28日从
    http://www.robertniles.com/stats/检索。