第八章 假设检验¶
假设检验¶
相关概念¶
- 基本思想:
- 基于概率的反证法:假设 \(H_{0}\) 成立,然后基于这个假设构造一个小概率事件,保证这个小概率事件在 \(H_{0}\) 成立时 几乎不会 在一次抽样(或试验)中发生。如果根据样本数据,发现这个小概率事件发生了,那么就有理由认为 \(H_{0}\) 不成立,即做出拒绝 \(H_{0}\) 而接受 \(H_{1}\) 的决策;否则就没有充分的理由拒绝 \(H_{0}\),从而接受 \(H_{0}\)
- 这个反证法用到了一个符合常规的基本原理,即概率很小的事件在一次实验中几乎不会发生,通常称其为 小概率事件原理 ,它是进行假设检验的基本法则
- 显著性水平与临界值:
- 显著性水平:为了体现小概率事件的“小”和差距的“大”,我们引入 \(\alpha\) 表示这个小概率,并称其为 显著性水平 (\(\alpha\) 一般取 \(0.1,0.05,0.01\) 等)
- 临界值:同时引入 \(C\) 表示差距,并称其为 临界值 ,它们满足 \(P(|\bar{X}-X_0|>C)=\alpha\)
- 一旦显著性水平给定,临界值就成为判断小概率事件是否发生的一个分界线
- 拒绝域:为处理实际问题更直观方便,我们定义一个区域,当样本观测值落入这个区域,就拒绝 \(H_{0}\),否则就接受 \(H_{0}\),称这个区域为 拒绝域
- 在给定显著性水平 \(\alpha\) 时,确定临界值和拒绝域使用类似参数估计的方法确定。我们构造一个含有参数的样本函数,把这样构造的样本函数称为 检验统计量 ,代入样本观测值即得到 检验统计量的值
- 参数假设检验与非参数假设检验:
- 总体的分布类型是已知的,仅涉及总体末知参数的检验称为 参数假设检验
- 对总体的末知分布的类型或某些特征的检验称为 非参数假设检验
- 双侧检验与单侧检验:
- 拒绝域 \(\mathscr{W}\) 位于两侧,这类假设检验称为 双侧检验
- 拒绝域 \(\mathscr{W}\) 在左侧,这类假设检验称为 左侧检验 ,而拒绝域 \(\mathscr{W}\) 在右侧的假设检验称为 右侧检验 ,左侧检验和右侧检验统称为 单侧检验
参数假设检验的基本步骤¶
设总体 \(X\) 的分布函数为 \(F(x)\),一般来说 \(F(x)\) 完全或部分末知,又设 \(X_{1},X_{2},\cdots,X_{n}\) 为总体 \(X\) 的一个简单随机样本,相应的样本观测值为 \(x_{1},x_{2},\cdots,x_{n}\)
- 把实际问题转换为假设检验问题,提出 原假设 \(H_{0}\) 和 备择假设 \(H_{1}\)(通常把研究者要证明的假设作为 备择假设 ;将所作出的声明/现状/不能轻易否定的假设作为 原假设 )
- 在 \(H_{0}\) 成立的条件下,构造适当的 检验统计量 ,例如 \(U=g\left(X_{1},X_{2},\cdots,X_{n}\right)\),要求 \(U\) 的分布完全已知(不含末知参数)
-
给定一个很小的 \(\alpha\)(称为 显著性水平 ),由 \(U\) 构造拒绝域 \(\mathscr{W}\),使得当 \(H_{0}\) 成立时,
\[ P\left(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\right) \leqslant \alpha \]即构造一个小概率事件“\(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\)”
-
代入样本数据,计算检验统计量 \(U\) 的观测值 \(\hat{U}=g\left(x_{1},x_{2},\cdots,x_{n}\right)\),由此判断 \(\left(X_{1},X_{2},\cdots,X_{n}\right)\) 是否落在 \(\mathscr{W}\) 中,从而做出决策,即
- 若 \(\left(X_{1},X_{2},\cdots,X_{n}\right) \in \mathscr{W}\),则拒绝 \(H_{0}\)
- 若 \(\left(X_{1},X_{2},\cdots,X_{n}\right) \notin \mathscr{W}\),则接受 \(H_{0}\)
决策错误¶
第一类错误¶
如果原假设 \(H_0\) 为真,由于样本的随机性,恰巧使所构造的小概率事件发生了,根据上述方法做出拒绝 \(H_0\) 的决策,此时就犯了错误,称这类错误为 第Ⅰ类错误(又称为 “弃真”错误)
-
犯第Ⅰ类错误的概率为
\[ P\left(\text{拒绝} H_{0} \mid H_{0} \text{为真}\right) \leqslant \alpha \] -
犯第Ⅰ类错误的概率不会超过显著性水平 \(\alpha\),\(\alpha\) 越小,犯第 Ⅰ 类错误的概率就越小
- 当 \(\alpha = 0.05\) 时,拒绝 \(H_0\) 称为是“显著”的
- 当 \(\alpha = 0.01\) 时,拒绝 \(H_0\) 称为是“高度显著”的
第二类错误¶
而如果 \(H_0\) 实际上为假(即 \(H_1\) 为真),但根据样本错误地接受了 \(H_0\),此时也犯了错误,称这类错误为 第Ⅱ类错误(又称为 “存伪”错误)
-
犯第Ⅱ类错误的概率为
\[ P \left(\text{接受} H_{0} \mid H_{0} \text{为假}\right)=P \left(\text{接受} H_{0} \mid H_{1} \text{为真}\right)=\beta \]
两种情况¶
所做判断 |
|||
| 接受 $H_0$ | 拒绝 $H_0$ | ||
| 实际情况 | $H_0$ 为真 | 正确($1-\alpha$) | 犯第Ⅰ类错误($\le \alpha$) |
| $H_0$ 为假 | 犯第Ⅱ类错误($\beta$) | 正确($1-\beta$) | |
p 检验法¶
在 \(p\) 值检验法中,无须事先给出显著性水平,在原假设 \(H_{0}\) 成立的基础上所构造的检验统计量 \(U\) 以及拒绝域 \(\mathscr{W}\) 都与经典方法相同
- p 检验的基本步骤
- 首先算出检验统计量的观测值(把它记为 \(u_{0}\)),再计算事件 \(|U|> \left|u_{0}\right|\) 的概率,假设 \(P\left(|U|>\left|u_{0}\right|\right)=p\),这个 \(p\) 值就等于拒绝原假设的概率
- 如果这个 \(p\) 值很小,我们认为发生这个事件的可能性非常小,因而拒绝 \(H_{0}\);如果这个概率不算太小,则接受原假设
- p 值检验法和经典方法的关联:
- 假设设定了一个显著性水平 \(\alpha\),此时如果 \(p \leqslant \alpha\),则表明比 \(\alpha\) 更小概率值的事件发生了,故拒绝 \(H_{0}\);
- 反之,若 \(p>\alpha\),则接受 \(H_{0}\)
单个正态总体参数的假设检¶
单个正态总体均值的假设检验¶
方差已知 (U 检验法)¶
检验统计量:
| 原假设 \(H_0\) | 备择假设 \(H_1\) | 拒绝域 \(\mathscr{W}\) |
|---|---|---|
| \(\mu=\mu_0\) | \(\mu\ne\mu_0\) | \(\mid U\mid\ge z_\frac{\alpha}{2}\) |
| \(\mu\ge\mu_0\) | \(\mu<\mu_0\) | \(U\le -z_\alpha\) |
| \(\mu\le\mu_0\) | \(\mu>\mu_0\) | \(U\ge z_\alpha\) |
方差未知¶
小样本 (\(n<30\)) 情况下,用 t 分布来检验总体均值,通常称为 t 检验,统计量
| 原假设 \(H_0\) | 备择假设 \(H_1\) | 拒绝域 \(\mathscr{W}\) |
|---|---|---|
| \(\mu=\mu_0\) | \(\mu\ne\mu_0\) | \(\mid T\mid\ge t_\frac{\alpha}{2}(n-1)\) |
| \(\mu\ge\mu_0\) | \(\mu<\mu_0\) | \(T\le -t_\alpha(n-1)\) |
| \(\mu\le\mu_0\) | \(\mu>\mu_0\) | \(T\ge t_\alpha(n-1)\) |
单个正态总体方差的假设检验¶
均值已知¶
选取检验统计量
| 原假设 \(H_0\) | 备择假设 \(H_1\) | 拒绝域 \(\mathscr{W}\) |
|---|---|---|
| \(\sigma^2=\sigma_0^2\) | \(\sigma^2\ne\sigma_0^2\) | \(\chi^2\ge \chi_\frac{\alpha}{2}(n)\) 或 \(\chi^2\le \chi_{1-\frac{\alpha}{2}}(n)\) |
| \(\sigma^2\ge\sigma_0^2\) | \(\sigma^2<\sigma_0^2\) | \(\chi^2\le \chi_{1-\alpha}(n)\) |
| \(\sigma^2\le\sigma_0^2\) | \(\sigma^2>\sigma_0^2\) | \(\chi^2\ge \chi_\alpha(n)\) |
均值未知¶
选取检验统计量
| 原假设 \(H_0\) | 备择假设 \(H_1\) | 拒绝域 \(\mathscr{W}\) |
|---|---|---|
| \(\sigma^2=\sigma_0^2\) | \(\sigma^2\ne\sigma_0^2\) | \(\chi^2\ge \chi_\frac{\alpha}{2}(n-1)\) 或 \(\chi^2\le \chi_{1-\frac{\alpha}{2}}(n-1)\) |
| \(\sigma^2\ge\sigma_0^2\) | \(\sigma^2<\sigma_0^2\) | \(\chi^2\le \chi_{1-\alpha}(n-1)\) |
| \(\sigma^2\le\sigma_0^2\) | \(\sigma^2>\sigma_0^2\) | \(\chi^2\ge \chi_\alpha(n-1)\) |
随机事件概率 p 的假设检验¶
选取检验统计量
| 原假设 \(H_0\) | 备择假设 \(H_1\) | 拒绝域 \(\mathscr{W}\) |
|---|---|---|
| \(p=p_0\) | \(p\ne p_0\) | \(\mid U\mid\ge z_\frac{\alpha}{2}\) |
| \(p\ge p_0\) | \(p<p_0\) | \(U\le -z_\alpha\) |
| \(p\le p_0\) | \(p>p_0\) | \(U\ge z_\alpha\) |