检验统计量是什么(什么是检验统计量?)

106次阅读

共计 2513 个字符，预计需要花费 7 分钟才能阅读完成。

今天给大家讲一篇关于统计学的知识，虽然当前机器学习，深度学习等大数据技术火得一塌糊涂，但归根结底，离不开统计学的基础，而谈到统计学，假设检验几乎是提到的最多的词语，到底什么是假设检验，什么是 P 值，什么时候用 t 检验，什么时候用 F 检验，非统计学背景的同学可能一脸懵逼，接下来我就讲下什么是假设检验

什么是假设检验？

首先明确下 假设检验在统计学里的地位：统计推断是统计学的重要分支，做统计推断有两个重要方法，即参数估计与假设检验。参数估计是用样本统计量估计总体参数，简单来说就是样本表现啥样，我就推断总体是啥样。而假设检验，则顾名思义，先提出一个假设，然后检验假设是否靠得住，例如假设均值为 μ，然后根据样本信息检验均值是不是 μ，通常我们是要去证明均值不是 μ，也就是去推翻原假设。逻辑上采用的是反证法，根据统计上的小概率原理，即假设是这样，但样本表现却不是这样，从而否定原假设。

举例来说，某官方数据说居民人均收入 10000，但我觉得这个不对，于是就局部范围内做了个统计（假如样本有代表性），统计出来平均值为 7000, 那我这个结果有没有信服力，那我们可以检验一下，计算出 P 值为 0.0002，那我可以很自信地说官方数据不对，不值得信。因为 P 值为 0.0002 意味着，如果居民人均工资为 1w，那么我统计出均值为 7k 的概率为 0.0002，这么小的概率竟然这么容易就让我选的这个局部统计碰上了，显然真实的人均工资不可能为 1w 啊，这就是根据小概率原理来推翻原假设。

假设检验的基本步骤

接下来我们讲一下假设检验的步骤，讲述过程中你也许会有疑问，为什么这样，不要担心，先往下看，我会陆续对假设检验的细节作出补充，如果未涉及到可以在评论中提出，我会补充上）：

步骤 1，提出假设，也就是我猜结果会是什么。猜完之后进入步骤 2，即我要拿什么去验证假设，这里我们叫做检验统计量。检验没有绝对的对错，所以我们要设定一个显著性水平，就是步骤 3，相当于设定一个门槛，在门外面就拒绝进门，统计学上叫拒绝域，拒绝的是原假设。套路第四步就是将门在哪儿计算出来，依据的是前两步确定的检验统计量以及显著性水平。最后就可以做出决策啦，看一下到底在门里面还是门外面。

接下来将提到的步骤跟大家详细说一下：

假设的提出包括原假设与备择假设。原假设（H0）则是我们收集证据想要推翻的假设, 而备择假设（H1）则是要去支持的，所以大家可以根据实际情况来设定原假设与备择假设。原假设与备择假设互斥。假设检验是围绕着对原假设是否成立展开的。假设检验还会涉及到两类错误的问题，这个内容较多，会单独讲解。

检验统计量是用于假设检验决策的统计量。如何去选择统计量呢？这与参数估计相同，需要考虑样本总体个数，样本大小，通常大于 30 个样品我们认为是大样本，以及总体方差是否已知，如果未知，可以用样品方差近似计算。是不是感觉有些头晕，撑住，这是做假设检验的关键，告诉你什么情况下采用什么样的检验方法，记住这儿，以后就不会没心没肺的只会 t 检验啦。贴心的我给大家整理了检验统计量的选择图谱，对家直接对号入座就可以啦，记住这些，再遇到假设检验的问题，你会感觉厉（niu）害 (bi) 的不要不要的。

配对样本的检验：两个总体参数的假设检验过程中，我们假定样本是独立的，但有种情况下样本间可能存在相依的关系，这种情况下两个正态总体的问题可以按照一个样品总体进行分析。举个例子：我想测试某个洗涤产品的洗涤效果，我可以测一下衣服洗之前的洁净程度，用产品洗之后的洁净程度，这样就得到了两个总体，可以按照方差未知的小样本 t 检验进行分析。但是，同是一件衣服，洗之前和洗之后数据之间是有对应关系的，我可以将洗前洗后的洁净程度做差值，检验差值是否为 0，这样就转化为一个总体样本的 t 检验。

具体的统计量的计算公式此处未给出，主要考虑到现在都用统计软件进行计算，关键要明确自己的统计问题，选择恰当的检验统计量，然后在统计软件上就可以开挂了！

显著性 α：这是犯一类错误的概率，即原假设为真时，拒绝原假设的概率。比如警察抓小偷时，明明是小偷，却判断失误当好人给放了的概率。也被称为抽样分布的拒绝域，这个可以由研究者事先确定。

计算检验统计量的值。当确定了检验统计量以及显著性 α 的值，通常为 0.01, 0.05，0.001，就可以通过统计软件或查表得到统计量的临界值 za 或 za/2，ta 或 ta/2

作出统计决策。统计决策的确定有两种方式，一种是将检验统计量的绝对值与 α 水平的临界值进行比较，高于临界值则拒绝原假设，低于临界值则不能拒绝。另外一种方式是采用 P 值进行决策。个人比较倾向第二种，当然现在的统计学软件会将这些值一并给出。我们通常将 P 值称为观测到的显著性水平，即当原假设为真时得到样本观察结果或者更极端结果的概率，如果 P 值很小，说明得到观测结果的概率很小，如果出现了，根据小概率原理，我就有理由拒绝原假设了。如果事先确定了显著性水平，比如 α = 0.05，在双侧检验中可以比较 P 值与 0.025 的大小决定是否拒绝原假设，单侧检验中可以比较 P 值与 0.05 的大小进行决策。当然也可以直接使用 P 值，按照我们所需要的显著性水平进行决策。

双侧检验

单侧检验

以上就是假设检验的基本原理及流程。懂了这些就几乎可以秒杀一切你所遇到的假设检验问题。还有同学经常问为何把小概率标准定为 0.05，哈哈，不要问我，因为我不知道。著名英国统计学家 Fisher 就这样用的，无解。

举例说明：

多吃谷物，将有助于减肥。为了验证这个假设，随机抽取了 35 人，询问他们早餐和午餐的通常食谱，根据他们的食谱，将其分为二类，一类为经常的谷类食用者(总体 1)，一类为非经常谷类食用者(总体 2)。然后测度每人午餐的大卡摄取量。经过一段时间的实验，得到如下结果：检验该假设(a = 0.05)

1. 原假设：u1-u2>=0

备择假设：u1-u2<0

2. 该情况为两个总体的 t 检验, 计算得 t =2.4869。注意此处为单侧检验。

3. 在 0.05 显著性水平上拒绝原假设。

4. 结论，没有证据证明多次谷物有助于减肥。

以上便是典型的假设检验讲解及过程。对于 数据科学方向 感兴趣的同学欢迎关注和留言，一起沟通学习。

丸趣 TV 网 – 提供最优质的资源集合！

正文完

假设假设检验检验统计统计学

发表至：热点

2024-04-13

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

关于简谐振动(什么是简谐振动?)