跳转至

第五章 大数定律和中心极限定理

大数定律预备知识

关于期望的重要不等式

设非负连续性随机变量 \(X\) 的期望 \(E(X)\) 存在,则对于任意实数 \(\varepsilon > 0\),有

\[ P(X \geq \varepsilon) \leq \frac{E(X)}{\varepsilon} \]

马尔可夫(Markov)不等式

马尔可夫不等式描述的是非负随机变量绝对位置的概率上限,设随机变量 \(X\)\(k\) 阶绝对原点矩 \(E(|X|^k)\) 存在,则对于任意实数 \(\varepsilon >0\),则有

\[ P(|X| \geq \varepsilon) \leq \frac{E\left(|X|^{k}\right)}{\varepsilon^{k}} \]

切比雪夫(Chebyshev)不等式

切比雪夫不等式描述的是随机变量距期望相对位置偏离的概率上限,设随机变量 \(X\) 的期望 \(E(X)=\mu\) ,方差 \(D(X) = \sigma^2\),则对于任意实数 \(\varepsilon > 0\),恒有

\[ P(|X-\mu| \geqslant \varepsilon) \leqslant \frac{\sigma^{2}}{\varepsilon^{2}} \]

\[ P(|X-\mu|<\varepsilon)>1-\frac{\sigma^{2}}{\varepsilon^{2}} \]

依概率收敛

\(Y_{1},Y_{2},\cdots,Y_{n},\cdots\) 是一个随机变量序列,\(X\) 是一个随机变量,若 \(\forall \varepsilon > 0\),有

\[ \lim _{n \rightarrow+\infty} P\left(\left|Y_{n}-X\right| \geqslant \varepsilon\right)=0 \]

\[ \lim _{n \rightarrow+\infty} P\left(\left|Y_{n}-X\right|<\varepsilon\right)=1 \]

则称随机变量序列 \(Y_{1},Y_{2},\cdots,Y_{n},\cdots\) 依概率收敛于 \(X\),记作 \(Y_{n} \underset{n \rightarrow+\infty}{\stackrel{P}{\longrightarrow}} X\)

大数定律

定义

若随机变量序列 \(X_{1},X_{2},\cdots,X_{n},\cdots\) 满足 \(\forall \varepsilon>0\),有

\[ \lim _{n \rightarrow+\infty} P\left(\left|\frac{1}{n} \sum_{k=1}^{n} X_{k}-\frac{1}{n} \sum_{k=1}^{n} E\left(X_{k}\right)\right|<\varepsilon\right)=1 \]

则称该序列服从 大数定律

  • 当试验次数进行到无穷大时,某一随机变量取值的邻域内概率收敛至 1

伯努利(Bernoulli)大数定律

\(n_{A}\) 表示 \(n\) 次独立重复试验中事件 \(A\) 发生的次数,\(p\) 是每次试验中 \(A\) 发生的概率 (即 伯努利 试验),则 \(\forall \varepsilon > 0\),有

\[ \lim _{n \rightarrow+\infty} P\left(\left|\frac{n_{A}}{n}-p\right| \geqslant \varepsilon\right)=0 \]

\[ \lim _{n \rightarrow+\infty} P\left(\left|\frac{n_{A}}{n}-p\right|<\varepsilon\right)=1 \]

即随机事件 \(A\)\(n\) 次试验中发生的 频率 \(\dfrac{n_A}{n}\) 依概率收敛\(A\) 在一次试验中发生的 概率 \(p\)

切比雪夫(Chebyshev)大数定律

若满足以下条件:

  • 随机变量序列 \(X_{1},X_{2},\cdots,X_{n},\cdots\) 两两不相关\(\rho_{X_iX_j} = 0\ (i\neq j)\)
  • 方差 存在且 有共同上界\(D\left(X_{k}\right)=\sigma_{k}^{2} \leqslant \sigma^{2},k= 1,2,\cdots,n,\cdots\)

则该序列服从大数定律,记 \(E(X_k) = \mu_k\),则 \(\forall \varepsilon > 0\),则有

\[ \lim _{n \rightarrow+\infty} P\left(\left|\frac{1}{n} \sum_{k=1}^{n} X_{k}-\frac{1}{n} \sum_{k=1}^{n} \mu_{k}\right|<\varepsilon\right)=1 \]

辛钦(Khintchine)大数定律

随机变量序列 \(X_{1},X_{2},\cdots,X_{n},\cdots\) 满足以下条件:

  • 独立同分布(i.i.d.)
  • 数学期望存在,\(E(X_k) = \mu,k=1,2,\cdots\)

则该序列服从大数定律,对 \(\forall \varepsilon > 0\),有

\[ \lim _{n \rightarrow+\infty} P\left(\left|\frac{1}{n} \sum_{k=1}^{n} X_{k}-\mu\right|<\varepsilon\right)=1 \]

马尔科夫(Markov)大数定律

设一个随机变量序列满足

\[ D\left(\dfrac1n\sum_{k=1}^{n} X_{k}\right) = \frac{1}{n^{2}} D\left(\sum_{k=1}^{n} X_{k}\right) \stackrel{n \rightarrow \infty}{\longrightarrow } 0 \]

则该随机变量序列服从大数定律,即对 \(\forall \varepsilon > 0\),有

\[ \lim_{n \rightarrow \infty} P\left(\left|\frac{1}{n} \sum_{i=1}^{n} X_{i}-\frac{1}{n} \sum_{i=1}^{n} E\left(X_{i}\right)\right|<\varepsilon\right)=1 \]

中心极限定理

独立同分布的中心极限定理

\(X_{1},X_{2},\cdots,X_{n},\cdots\) 为独立同分布的随机变量序列,\(E(X_k) = \mu,D(X_k) = \sigma^2,k=1,2,\cdots,n,\cdots\),记 \(\displaystyle\sum_{k=1}^n X_k\) 的标准化随机变量为

\[ Y_n = \dfrac{\displaystyle\sum_{k=1}^nX_k-n\mu}{\sqrt{n}\ \sigma} \]

\[ \lim_{n\to \infty}P(Y_n\le y) \approx \mathit \Phi (y) = \dfrac{1}{\sqrt{2\pi}}\int_{-\infty}^y\mathrm e^{-\frac{t^2}{2}}\ \mathrm dt \]

\(n\to\infty\) 时,\(Y_n\sim N(0,1)\)\(\displaystyle\sum_{k=1}^n X_k \sim N(n\mu,n\sigma^2)\)

\[ P\left(\sum_{k=1}^n X_k \le x\right)\approx \mathit\Phi\left(\dfrac{x - n\mu}{\sqrt n\ \sigma}\right) \]

棣莫弗—拉普拉斯(De Moivre-Laplace)中心极限定理

随机变量 \(Y_n\sim B(n,p),0<p<1,n=1,2,\cdots\),则

\[ Y_n\sim N(np,np(1-p)) 或 \dfrac{Y_n - np}{\sqrt{np(1-p)}}\sim N(0,1) \]

用频率估计概率

可以用切比雪夫不等式估计概率,但是用中心极限定理通过频率估计得到的结果更精确

\[ \begin{aligned} &P\left\{\left|\dfrac{\eta_{n}}{n}-p\right|<\varepsilon\right\}\\ =&P\left\{\left|\dfrac{\eta_{n}-n p}{n}\right|<\varepsilon\right\} \\ =&P\left\{-\varepsilon \sqrt{\dfrac{n}{p q}}<\dfrac{\eta_{n}-n p}{\sqrt{n p q}}<\varepsilon \sqrt{\dfrac{n}{p q}}\right\} \\ \approx &\Phi\left(\varepsilon \sqrt{\dfrac{n}{p q}}\right)-\Phi\left(-\varepsilon \sqrt{\dfrac{n}{p q}}\right)\\ =& 2 \Phi\left(\varepsilon \sqrt{\dfrac{n}{p q}}\right)-1 \end{aligned} \]