跳转至

第八章 假设检验

假设检验

相关概念

  • 基本思想
    • 基于概率的反证法:假设 \(H_{0}\) 成立,然后基于这个假设构造一个小概率事件,保证这个小概率事件在 \(H_{0}\) 成立时 几乎不会 在一次抽样(或试验)中发生。如果根据样本数据,发现这个小概率事件发生了,那么就有理由认为 \(H_{0}\) 不成立,即做出拒绝 \(H_{0}\) 而接受 \(H_{1}\) 的决策;否则就没有充分的理由拒绝 \(H_{0}\),从而接受 \(H_{0}\)
    • 这个反证法用到了一个符合常规的基本原理,即概率很小的事件在一次实验中几乎不会发生,通常称其为 小概率事件原理 ,它是进行假设检验的基本法则
  • 显著性水平与临界值
    • 显著性水平:为了体现小概率事件的“小”和差距的“大”,我们引入 \(\alpha\) 表示这个小概率,并称其为 显著性水平\(\alpha\) 一般取 \(0.1,0.05,0.01\) 等)
    • 临界值:同时引入 \(C\) 表示差距,并称其为 临界值 ,它们满足 \(P(|\bar{X}-X_0|>C)=\alpha\)
    • 一旦显著性水平给定,临界值就成为判断小概率事件是否发生的一个分界线
  • 拒绝域:为处理实际问题更直观方便,我们定义一个区域,当样本观测值落入这个区域,就拒绝 \(H_{0}\),否则就接受 \(H_{0}\),称这个区域为 拒绝域
  • 在给定显著性水平 \(\alpha\) 时,确定临界值和拒绝域使用类似参数估计的方法确定。我们构造一个含有参数的样本函数,把这样构造的样本函数称为 检验统计量 ,代入样本观测值即得到 检验统计量的值
  • 参数假设检验与非参数假设检验
    • 总体的分布类型是已知的,仅涉及总体末知参数的检验称为 参数假设检验
    • 对总体的末知分布的类型或某些特征的检验称为 非参数假设检验
  • 双侧检验与单侧检验
    • 拒绝域 \(\mathscr{W}\) 位于两侧,这类假设检验称为 双侧检验
    • 拒绝域 \(\mathscr{W}\) 在左侧,这类假设检验称为 左侧检验 ,而拒绝域 \(\mathscr{W}\) 在右侧的假设检验称为 右侧检验 ,左侧检验和右侧检验统称为 单侧检验

参数假设检验的基本步骤

设总体 \(X\) 的分布函数为 \(F(x)\),一般来说 \(F(x)\) 完全或部分末知,又设 \(X_{1},X_{2},\cdots,X_{n}\) 为总体 \(X\) 的一个简单随机样本,相应的样本观测值为 \(x_{1},x_{2},\cdots,x_{n}\)

  1. 把实际问题转换为假设检验问题,提出 原假设 \(H_{0}\)备择假设 \(H_{1}\)(通常把研究者要证明的假设作为 备择假设 ;将所作出的声明/现状/不能轻易否定的假设作为 原假设
  2. \(H_{0}\) 成立的条件下,构造适当的 检验统计量 ,例如 \(U=g\left(X_{1},X_{2},\cdots,X_{n}\right)\),要求 \(U\) 的分布完全已知(不含末知参数)
  3. 给定一个很小的 \(\alpha\)(称为 显著性水平 ),由 \(U\) 构造拒绝域 \(\mathscr{W}\),使得当 \(H_{0}\) 成立时,

    \[ P\left(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\right) \leqslant \alpha \]

    即构造一个小概率事件“\(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\)

  4. 代入样本数据,计算检验统计量 \(U\) 的观测值 \(\hat{U}=g\left(x_{1},x_{2},\cdots,x_{n}\right)\),由此判断 \(\left(X_{1},X_{2},\cdots,X_{n}\right)\) 是否落在 \(\mathscr{W}\) 中,从而做出决策,即

    • \(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\),则拒绝 \(H_{0}\)
    • \(\left(X_{1},X_{2},\cdots,X_{n}\right) \notin \mathscr{W}\),则接受 \(H_{0}\)

决策错误

第一类错误

如果原假设 \(H_0\) 为真,由于样本的随机性,恰巧使所构造的小概率事件发生了,根据上述方法做出拒绝 \(H_0\) 的决策,此时就犯了错误,称这类错误为 第Ⅰ类错误(又称为 “弃真”错误

  • 犯第Ⅰ类错误的概率为

    \[ P\left(\text{拒绝} H_{0} \mid H_{0} \text{为真}\right) \leqslant \alpha \]
  • 犯第Ⅰ类错误的概率不会超过显著性水平 \(\alpha\)\(\alpha\) 越小,犯第 Ⅰ 类错误的概率就越小

    • \(\alpha = 0.05\) 时,拒绝 \(H_0\) 称为是“显著”的
    • \(\alpha = 0.01\) 时,拒绝 \(H_0\) 称为是“高度显著”的

第二类错误

而如果 \(H_0\) 实际上为假(即 \(H_1\) 为真),但根据样本错误地接受了 \(H_0\),此时也犯了错误,称这类错误为 第Ⅱ类错误(又称为 “存伪”错误

  • 犯第Ⅱ类错误的概率为

    \[ P \left(\text{接受} H_{0} \mid H_{0} \text{为假}\right)=P \left(\text{接受} H_{0} \mid H_{1} \text{为真}\right)=\beta \]

两种情况

所做判断
接受 $H_0$ 拒绝 $H_0$
实际情况 $H_0$ 为真 正确($1-\alpha$) 犯第Ⅰ类错误($\le \alpha$)
$H_0$ 为假 犯第Ⅱ类错误($\beta$) 正确($1-\beta$)

p 检验法

\(p\) 值检验法中,无须事先给出显著性水平,在原假设 \(H_{0}\) 成立的基础上所构造的检验统计量 \(U\) 以及拒绝域 \(\mathscr{W}\) 都与经典方法相同

  • p 检验的基本步骤
    • 首先算出检验统计量的观测值(把它记为 \(u_{0}\)),再计算事件 \(|U|> \left|u_{0}\right|\) 的概率,假设 \(P\left(|U|>\left|u_{0}\right|\right)=p\),这个 \(p\) 值就等于拒绝原假设的概率
    • 如果这个 \(p\) 值很小,我们认为发生这个事件的可能性非常小,因而拒绝 \(H_{0}\);如果这个概率不算太小,则接受原假设
  • p 值检验法和经典方法的关联:
    • 假设设定了一个显著性水平 \(\alpha\),此时如果 \(p \leqslant \alpha\),则表明比 \(\alpha\) 更小概率值的事件发生了,故拒绝 \(H_{0}\)
    • 反之,若 \(p>\alpha\),则接受 \(H_{0}\)

单个正态总体参数的假设检

单个正态总体均值的假设检验

方差已知 (U 检验法)

检验统计量:

\[ U=\frac{\bar{X}-\mu_{0}}{\sigma / \sqrt{n}} \sim N(0,1) \]
原假设 \(H_0\) 备择假设 \(H_1\) 拒绝域 \(\mathscr{W}\)
\(\mu=\mu_0\) \(\mu\ne\mu_0\) \(\mid U\mid\ge z_\frac{\alpha}{2}\)
\(\mu\ge\mu_0\) \(\mu<\mu_0\) \(U\le -z_\alpha\)
\(\mu\le\mu_0\) \(\mu>\mu_0\) \(U\ge z_\alpha\)

方差未知

小样本 (\(n<30\)) 情况下,用 t 分布来检验总体均值,通常称为 t 检验,统计量

\[ T=\frac{\bar{X}-\mu_{0}}{S / \sqrt{n}} \sim t(n-1) \]
原假设 \(H_0\) 备择假设 \(H_1\) 拒绝域 \(\mathscr{W}\)
\(\mu=\mu_0\) \(\mu\ne\mu_0\) \(\mid T\mid\ge t_\frac{\alpha}{2}(n-1)\)
\(\mu\ge\mu_0\) \(\mu<\mu_0\) \(T\le -t_\alpha(n-1)\)
\(\mu\le\mu_0\) \(\mu>\mu_0\) \(T\ge t_\alpha(n-1)\)

单个正态总体方差的假设检验

均值已知

选取检验统计量

\[ \chi^{2}=\frac{\sum_{i=1}^{n}\left(X_{i}-\mu\right)^{2}}{\sigma_{0}^{2}} \sim \chi^{2}(n) \]
原假设 \(H_0\) 备择假设 \(H_1\) 拒绝域 \(\mathscr{W}\)
\(\sigma^2=\sigma_0^2\) \(\sigma^2\ne\sigma_0^2\) \(\chi^2\ge \chi_\frac{\alpha}{2}(n)\)\(\chi^2\le \chi_{1-\frac{\alpha}{2}}(n)\)
\(\sigma^2\ge\sigma_0^2\) \(\sigma^2<\sigma_0^2\) \(\chi^2\le \chi_{1-\alpha}(n)\)
\(\sigma^2\le\sigma_0^2\) \(\sigma^2>\sigma_0^2\) \(\chi^2\ge \chi_\alpha(n)\)

均值未知

选取检验统计量

\[ \chi^{2}=\frac{(n-1) S^{2}}{\sigma_{0}^{2}}=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{\sigma_{0}^{2}} \sim \chi^{2}(n-1) \]
原假设 \(H_0\) 备择假设 \(H_1\) 拒绝域 \(\mathscr{W}\)
\(\sigma^2=\sigma_0^2\) \(\sigma^2\ne\sigma_0^2\) \(\chi^2\ge \chi_\frac{\alpha}{2}(n-1)\)\(\chi^2\le \chi_{1-\frac{\alpha}{2}}(n-1)\)
\(\sigma^2\ge\sigma_0^2\) \(\sigma^2<\sigma_0^2\) \(\chi^2\le \chi_{1-\alpha}(n-1)\)
\(\sigma^2\le\sigma_0^2\) \(\sigma^2>\sigma_0^2\) \(\chi^2\ge \chi_\alpha(n-1)\)

随机事件概率 p 的假设检验

选取检验统计量

\[ U=\frac{\bar{X}-p_{0}}{\sqrt{p_{0}\left(1-p_{0}\right) / n}} \stackrel{\text { 近似 }}{\sim} N(0,1) \]
原假设 \(H_0\) 备择假设 \(H_1\) 拒绝域 \(\mathscr{W}\)
\(p=p_0\) \(p\ne p_0\) \(\mid U\mid\ge z_\frac{\alpha}{2}\)
\(p\ge p_0\) \(p<p_0\) \(U\le -z_\alpha\)
\(p\le p_0\) \(p>p_0\) \(U\ge z_\alpha\)