提高实验测量效果的能力




Sandra Slutz博士,科学伙伴科学家
Kenneth L. Hess,科学伙伴创始人兼总裁

所有实验观察结果都是信号,变量对结果的真实影响以及噪声(实验技术中固有的随机误差)的组合。在设计和分析实验时,目标是最大化信噪比,以便您可以得出准确的结论。增加信噪比的六种常用方法是:

  1. 重复测量一个项目,

  2. 增加样本量,

  3. 随机化样本,

  4. 随机化实验,

  5. 重复实验,和

  6. 包括协变量。

很少将任何一个科学问题本身借给利用这些信号与噪声降低技术全部六个,但最大限度地提高结果的准确性,你应该尝试尽可能多的这些作为合并合理地融入你的实验设计。成本,时间和资源可用性将有助于决定哪些技术可行,哪些技术不可行。下面的表1概述了每种技术最有用的场景类型。

定量变量
提高信噪比的技术它是什么?什么时候有用?何时使用它的示例
重复测量单次测量单个项目或事件以消除测量中的错误。

对单个事件的更多测量可以更有信心计算准确的平均测量值。
如果单个测量可能有很多变化,则特别有用; 因为它必须快速制作,很难确定确切的终点,或者在技术上很难,因此容易出错。

如果测量是明确的,则不会增加价值,例如关于人的年龄或以米为单位测量房间尺寸的调查问题的答案。
  • 改变这种指示剂溶液的颜色需要多少滴酸?在相同溶液的等分试样上运行反应几次。

  • 这个特定的显卡需要多长时间才能将周围的空气加热到100°C?多次测试相同的图形卡。

  • 这只乌龟在浮出水面之前在水下待多久了?多次观察同一只乌龟。

增加样本量增加从中收集数据的项目或人员数量会增加您观察到的内容指示整个人口的概率。

可以进行计算以确定样本大小需要多大。有关更多详细信息,请参阅有关确定
调查最佳样本量的指南。
当你试图得出关于整个人口的结论时,特别有用。

如果您的结论旨在针对个人或单个项目,则不适用。
  • 青少年吃健康食品吗?调查了大量的青少年,而不仅仅是五个总是在一起闲逛的人,关于他们的日常饮食。

  • 吸烟者与非吸烟者的肺活量相比如何?从许多吸烟者和非吸烟者那里获取测量结果。

  • 品牌X的9伏(V)电池能为手电筒供电多长时间?测试品牌X的9-V电池的多个制造批次。

样本随机化使用抽奖系统将样本分配给给定实验中的不同实验组和对照组有助于使组的起始组成尽可能相等,即使对于您可能忽略的变量也是如此。

一些实验可以完全随机化; 其他涉及首先阻止。阻止允许创建同源组,如男性与女性,然后在块内随机化。当研究人员怀疑实验对象之间可能存在科学上重要的差异时,就会进行这种变化。
当您从中抽取样本的人群(这是您想要得出结论的人口)时,尤其重要。

如果您需要对人口进行分层,可能不适用,因为您希望能够对每个子组得出不同的结论。例如,药物研究中的男性与女性或电路设计中的不同类型的电阻器。
  • 哪种施肥技术最能提高作物产量?通过抽奖为每块土地分配肥料处理,从而在实验组中平衡其他变量的影响,如土壤构成和含水量。

  • 这种药物可以减少骨质疏松症吗?随机分配人员确定药物是否有效。随机分配患者安慰剂或药物组。

随机化实验使用彩票系统来确定执行相关实验的顺序,而不是依赖于可能引入其他被忽视的变量的明显逻辑顺序。当您进行相关实验时,尤其关键,您将从中得出单个元结论。

适用于使用相同设备连续完成的相关实验,以及在不同设备上并行完成的相关实验。
  • 塑料在模具中按压的时间长短会影响塑料的最终强度吗?而不是运行实验测试10秒,20秒,30秒等背靠背按压,随机化测试第一,第二等时间长度。随机化消除了其他变量的潜在影响,如塑料的不同混合时间量随着实验的进行以及在所有实验过程中模具温度的变化。

  • 鼠标迷宫墙的颜色是否会影响老鼠找到路过的总时间?对于单个实验重复,在所有迷宫中在同一天测试所有小鼠。迷宫应该是相同的,除了墙壁颜色。对于每只小鼠,随机确定他应该在不同颜色的迷宫中测试的顺序。随机化将消除测试过程中鼠标疲劳等影响的潜在贡献。

重复实验不止一次重复实验有助于确定数据是否是侥幸,或代表正常情况。它有助于防止在没有足够证据的情况下跳出结论。

重复次数取决于许多因素,包括数据的传播和资源的可用性。三次重复通常是评估数据传播的良好起点。
重复实验是大多数领域的标准科学实践。例外情况通常是实验的规模和成本使其无法实现。例如,在罕见的医学条件下的药物试验,大规模的社会学实验,以及罕见现象的天文观察。
  • 哪种波长的可见光发出的热量最多?对每个波长进行重复测量,随机化您进行波长实验的顺序,并在不同的日子使用不同的设备重复整组实验至少两次。

  • 热量限制如何影响蠕虫的寿命?从统计学上足够大的样本量开始,随机选择哪些蠕虫受到热量限制,哪些可以根据需要进食,从不同日期开始,使用不同批次的蠕虫重复整个实验至少两次。

包括协变量一些现象由多个变量控制。结果往往是这些协变量的总和。在对这些类型的现象进行建模或分析有关它们的数据时,最好将所有协变量包含在分析和/或模型中。这样可以最全面地了解正在发生的情况。如果您正在研究一个复杂现象,其结果取决于多个因素的总和,那么包括协变量是有帮助的。如果您无法严格控制所有变量,则尤为必要。例如,在药物研究,气候数据或食物链和生态系统分析中处理患者时。
  • 药物X如何影响患者的血压?从统计学上足够大,随机选择的患者样本开始。给他们一半药物X,另一半给他们安慰剂。评估结果,同时考虑其他变量,如性别,年龄和体重,已知会影响血压。

  • 评估特定物种的灭绝将如何影响当地生态系统的其他部分。关于各种物种之间相互作用的历史数据的基础预测模型,从濒危和分支开始的数据开始。

表1.最大化信噪比的六种最常用方法。

重复测量

对单个项目进行重复测量是一种强大但有限的技术。在测量具有挑战性的情况下,例如在观察和记录液体完全蒸发的确切时刻的情况下,它是非常有用的。在这些情况下,平均多次测量有助于消除测量误差。查看各个测量的范围和变化 - 例如,通过绘制所有测量 - 甚至可以帮助您确定测量技术是否足够或者过于不稳定而无法依赖。但是,如果测量结果简单明了,比如将沙袋称重到最接近千克的尺度,则重复测量不会增加任何价值,而是浪费时间和资源。

增加样本量

增加样本量是减少实验噪音的最常见方法之一。样本大小是指您在单个实验中进行测量或观察的项目,事件或人员数量。通常,实验中样本量越大,通过更改变量检测效果的功率(概率)就越大。样本大小到底有多大?您可以使用功效分析计算来确定有效的样本量。样本量:我需要多少调查参与者? 指南包括一些开始计算。其他解释和计算可以在统计教科书中找到,如参考书目中列出的那些(见下文)功耗分析了解更多)。但根据经验,预期效果越小,您应该计划收集的样本量越大。例如,如果你确定了男性和女性之间的生物学差异,那么10个男性和10个女性的样本量足以看出男性有一条X染色体而女性有两条,但是太小而无法确定男性是平均而言,比女性高。同样,您在给定实验中测试的变量越多,您应评估的样本数量就越多

随机化(样本和实验)

即使他们认识到所有潜在的变异来源,科学家也几乎不可能控制实验中的所有因素。温度,位置,设备或其他物理条件的微小差异可能导致实验偏差(一种结果优于另一种结果)和噪音。通过随机化可以减少实验偏差和噪声。样本和实验都可以随机化,尽管在单个科学项目中并不总是可以使用这两种策略。在样本随机化期间,通过抽签将测试对象分配给各种对照或实验组。例如,在研究新的饮食方案时,受试者将被随机分配到阴性对照组,在那里他们没有节食,阳性对照组,他们使用任何饮食方案被认为是黄金标准(即目前已知的最佳饮食),以及实验组,他们使用新的饮食方案。相反,如果允许受试者选择他们想要的群体,他们可能会偏向结果。愿意选择“无饮食”组的人可能倾向于吃更多的饭菜,或者选择遵循黄金标准饮食的人可能更有运动感。这些可能性中的任何一种,即消费更多食物或锻炼更多的倾向,都可能会扭曲结果。但是如果受试者是随机分配的,那么这些差异可能会分布在所有实验组和对照组中,因此,实验结果并没有明显偏差。

实验随机化可以应用于存在一系列测试的情况,其中测试的顺序可以通过抽奖来确定。在这些类型的情况下,它可用于减少数据中的意外偏差。例如,如果目标是找出普通成年人可承受的酸味的水平,则每个成年受试者将被给予一系列口味的明胶,每种明胶具有不同的酸味强度。然后测试对象将评估他们发现哪些明胶可以忍受并且太酸而不能吃。如果测试对象全部给予明胶味道,则以酸强度的递增顺序,结果将是人为膨胀的平均酸耐受性。为什么?因为系统地增加对酸味的暴露会使受试者的味蕾暂时脱敏,从而影响酸味。

重复实验

重复实验也会导致信噪比的增加。分析实验重复可以减少虚假效应(如略微升高的环境温度或读数太高的机器)推动结论的可能性。来自样品的数据在单个实验中一起收集; 重复实验需要独立,这意味着应该改变实际可能的许多实验参数:不同的样品,不同的机器,不同的日子,不同的实验者等。通常认为实验的三次重复是最小的。为什么?有两个原因,第一个原因是三个重复确保平均结果比单个实验更准确的三分之二(66%)概率。三分之二可能看起来不是很多,但重复的回报减少 - 超过三个,你必须做更多的重复,以大大增加信心。即使有500次重复,单次试验恰好比平均值更接近真实值的可能性很小。有关详细信息,请参见下面的表2。第二个原因是有三次重复,您有一个很好的基础来绘制和使用统计描述,如均值和平均值的标准误差,来评估您的数据,看看结果是否足够强大,可以得出结论,或者您是否需要收集更多数据。在某些情况下,由于资源限制,无法重复实验。例如,对亚马逊雨林等大片土地的生物调查只会进行一次。如果无法进行重复,则确保样本量足够大至关重要。对亚马逊雨林等大片土地进行的生物调查只能进行一次。如果无法进行重复,则确保样本量足够大至关重要。对亚马逊雨林等大片土地进行的生物调查只能进行一次。如果无法进行重复,则确保样本量足够大至关重要。

实验重复数%重复的平均值比单次试验更准确
260.8
366.7
470.5
73.2
1080.5
2086.0
4090.0
10093.7
16295.0
50097.2

表2.重复实验几次导致重复的平均值
比实验的单次试验更准确的统计机会大大增加,但随后的重复具有递减的回报。
(表格改编自Gauch,2006年。见基础理论的原始文本。)

包括协变量

许多自然系统和科学现象是许多因素的总和效应。这些因素称为协变量因为它们“共同变化”,共同控制最终结果。尽管科学家们常常对评估改变单个因素如何影响整个系统感兴趣,但建立一个只能改变和评估一个变量的实验可能是不切实际的,甚至是不可能的。例如,如果您想预测建造一个新的汽车制造厂将如何影响当地的空气质量,一种方法是确定工厂将贡献多少空气污染。但这种模式是不精确的。构建新工厂时可能会发生其他相关事件。例如,工厂将创造就业机会,更多人可能会迁移到该地区以利用这些工作。这些人会购买当地房屋,开车,开办相关行业等等。所有这些事件也会影响当地的空气质量。因此,更准确的评估将尽可能多地考虑协变量。

考虑协变量也有助于提高检测变化的能力。例如,假设您正在进行一项关于新药降低胆固醇的能力的研究。胆固醇水平由许多因素决定,包括:性别,年龄,家族史,饮食,体力活动和体重。在一项关于小鼠的研究中,你可以控制所有这些因素 - 你可以让老鼠具有相同的遗传,同样的年龄和性别,喂养相同的饮食,体重相同的量,并执行相同的锻炼制度。但是,与人类进行类似的完全对照研究是不可能的。您尝试控制的每个因素,您的研究人员越少,招募科目就越困难。另一种方法是仅限制一些变量,并测量剩余的协变量,以便将它们纳入最终的数据分析模型。使用该模型,您可以在数学上减去协变量的影响,并仍然可以看到您感兴趣的变量的影响:降胆固醇药物。

参考书目

这些资源提供了有关如何设计实验和提高科学数据中信噪比的其他信息: