技术文章

将t检验应用于工程系统

2020年10月12日经过罗伯特·基姆（Robert Keim）

本文提供了一个示例，说明了我们如何使用t检验来确定实验是否产生了系统性能的统计学意义变化。

本文是电气工程统计的文章集合的第13部分。到目前为止，我们已经介绍了很多内容，因此，如果您刚刚加入该系列，请务必查看以下主题列表。

实验室假设：什么导致高度？

让我们想象我们正在开发无线通信系统。该系统由发送器组成包装化数字数据对于接收器，我们量化性能的主要手段是数据包错误率（PER）。接收器使用循环冗余检查（CRC）识别和丢弃具有一个或多个错误位的数据包，而Per仅仅是放弃数据包与接收到的数据包的比率。

我们一直在测试和表征实验室的系统数月，因此，我们拥有大量的室温性能数据。

我们知道，当系统在实验室中运行并配置为对应于指定范围的最大范围的衰减时，平均每0.001，即对于每1,000个收到的数据包，必须丢弃一个数据包。

统计故障排除

不幸的是，我们在过去几周内进行了多次现场测试，并且该系统的性能不佳。

没有明显的Per原因，也没有立即明显的模式。因此，我们需要创建一些故障排除实验，以试图跟踪问题。当系统从实验室移动到现场时，各种情况都会发生变化，但是由于现场测试发生在死亡谷，因此温度可能是罪魁祸首。

我们的计划是提高实验室中的恒温器并收集每个数据。该系统不打算在极端温度下运行，因此我们不需要在125°C甚至70°C下进行测试。我们将尝试40°C，并且由于将实验室长时间保留在该温度下是昂贵的，因此我们将无法收集大量数据。

...三天后…

我们每次测量收集了9个40°C。每个测量代表在两个小时的运行期间观察到的每次观察到的。换句话说，我们加热了实验室，激活了系统，让它运行两个小时，并记录了PER。

然后，我们停用了该系统，使其可以保持一段时间的无效，重新激活它，并为新的两个小时的操作记录了一个新数据。每天三个两个小时的测试时间为三天，我们有9个数据点。

这是我们获得的每个值：

每
0.0010290
0.0010113
0.0010380
0.0010198
0.0009702
0.0010486
0.0010503
0.0009941
0.0010067

通过仅查看测量值，我们可以看到，每个测量值高于0.001的室温值，但是我们需要更仔细地检查数据以确定Per的变化是否具有统计学意义。

执行t检验

t检验需要t值，我们看到了在上一篇文章中我们计算出T值如下：

\ [t = \ frac {\ bar {x} - \ mu} {s/\ sqrt {n}}} \] \]

其中\（\ bar {x} \）是样本平均值，μ是群体平均值（或更一般而言，某些参考值用作比较点），s是样本标准偏差，n是样本量。

在此实验中，μ= 0.001，即室温下。样本量为9，在Excel的帮助下，我可以快速找到样品平均值和样本标准偏差：\（\ bar {x} = 0.001018667 \），s = 2.62881×10^-5。因此，

\ [t = \ frac {0.001018667-0.001} {2.62881 \ times10^{ - 5}/\ sqrt {9}}}} \ aid 2.13 \]

现在我们有了T值。下一步是找到比较该T值的阈值；我们将其称为临界值，用t*表示。我们需要的三个信息是我们实验数据的自由度（用ν表示），显着性水平以及我们是否将执行一尾或两尾测试。

我认为5％（⍺= 0.05）对于这样的实验而言是合理的显着性水平，而ν= n - 1 = 8。它不会改善Per。因此，我们将执行一项单尾测试。

看我们的桌子t分布临界值，我们看到T* = 1.86。

我们实验中的零假设指出，温度和Per之间没有有意义的关系。我们获得的2.13的T值大于1.86，因此在分布的排斥区域中。因此，我们拒绝零假设，并声称感兴趣的变量确实存在关系：较高的温度与较高的人相关。

结论

我们已经介绍了一个简单的示例，即具有重要性测试，作为对电子系统进行故障排除的技术。随着我们继续探索t检验，我们将把这个虚构的实验扩展到下一篇文章中。