第二章随机变量及其分布¶

Back to Course Home

随机变量及其分布函数¶

随机变量¶

定义：设随机试验的样本空间是 \(\mathit \Omega\)，若 \(\forall\omega\in\mathit\Omega\)，按⼀定的法则，存在⼀个实数 \(X(\omega)\) 与之对应，则称 \(\mathit\Omega\) 上的实值单值函数 \(X(\omega)\) 为 随机变量
\(X\) 为 \(\mathit\Omega\to\mathbb R\) 的一个映射
- 定义域为样本空间
- 随机性：可能取值不止一个，试验前只知道所有可能取值，但不知道具体哪一个
- 概率特性：随机变量以一定概率取某个值或某些值

随机变量的分布函数¶

定义：设 \(X\) 为一随机变量，对于任意实数 \(x\)，则 \(X\) 的 分布函数 为：

\[ F(x) = P (X\le x),\quad-\infty<x<+\infty \]

有时记作 \(F_X(x)\)
性质：
- \(F(x)\) 单调不减
  
  \[ \forall x_1<x_2, F(x_1)\le F(x_2) \]
- \(0\le F(x) \le 1\)，且
  
  \[ \lim_{x\to+\infty}F(x) = 1,\lim_{x\to-\infty}F(x) = 0 \]
用分布函数表示概率

\[ \begin{aligned} P(X\le x_0) &= F(x_0)\\ P(X<x_0) &=\lim_{\Delta x\to0_+}P(X\le x_0-\Delta x)\\ &=\lim_{\Delta x\to0_+}F(x_0-\Delta x)\\ &=F(x_0-0)\\ P(X=x_0) &= F(x_0) - F(x_0-0)\\ P(a<X\le b) &= F(b) - F(a) \end{aligned} \]

离散型随机变量及其分布律¶

离散型随机变量概率分布¶

定义：随机变量 \(X\) 的可能取值是有限个或可列无穷多个
分布律：设离散型随机变量 \(X\) 的所有可能取值为 \(X=x_k (k=1,2,\cdots)\)，不妨设 \(x_1<x_2<\cdots\)，则 \(X\) 的分布律为

\[ P(X=x_k) = p_k, k = 1,2,\cdots \]

性质：
1. \[ p_k\ge0, k = 1,2,\cdots \]
2. \[ \sum_{k=1}^{+\infty}p_k = 1 \]
分布函数：
- \[ F(x) = P(X\le x)=\sum_{x_k\le x}P(X=x_k) \]
- \[ P(X = x_k) = p_k = P(x_{k-1}<X\le x_k) = F(x_k) - F(x_{k-1}) \]
- \(F(x)\) 为分段阶梯函数
- 在 \(X\) 的可能取值处存在第一类跳跃间断点

常见离散型随机变量¶

0-1 分布 (两点分布)¶

随机变量只有两个可能取值，分布律由下表所示

\[ \begin{array}{c|cc} \hline \quad X\quad &\quad 1\quad &\quad 0\quad\\ \hline P&p&1-p\\ \hline \end{array} \]

其中 \(0<p<1\)，称 \(X\) 服从参数为 \(p\) 的 0-1 分布，记作 \(X\sim B(1,p)\)，

也可写成

\[ P(X=k)=p^k (1-p)^{1-k}, k = 0,1 \]

二项分布 (伯努利概型)¶

\(n\) 重 Bernoulli 试验：
1. 可独立地进行 \(n\) 次 (可能性互不影响)
2. 每次试验的结果仅两个，\(A\) 和 \(\overline A\)
对应的概型为 Bernoulli 概型
\(n\) 重 Bernoulli 试验中，设一次试验中事件 \(A\) 发生的概率为 \(P(A) = p (0<p<1)\)，则事件 \(A\) 发生次数 \(X\) 的分布律为

\[ P(X=k) = \mathrm C_n^k p^k (1-p)^{n-k}, k = 0, 1, \cdots, n \]
称 \(X\) 服从参数为 \((n,p)\) 的 二项分布，记为 \(X\sim B(n,p)\)

\[ P(X>N) = \sum_{k = N+1}^nP(X = k) \]
求出最可能出现的次数

\[ \begin{cases} \dfrac{P_{k-1}}{P_k} = \dfrac{(1-p) k}{p (n-k+1)}\le1,\\ \dfrac{P_k}{P_{k+1}} = \dfrac{(1-p) (k+1)}{p (n-k)}\ge1, \end{cases} \implies(n+1) p-1\le k \le (n+1) p \]
超几何分布的极限分布是二项分布

负二项分布 (Pascal 分布)¶

进行一个试验直到成功 \(r\) 次，试验进行了 \(k\) 次的分布律，称为 负二项分布，记为 \(X\sim NB(r,p)\)

\[ P(X=k) = \mathrm C_{k-1}^{r-1} p^r (1-p)^{k-r}, k = r, r+1, \cdots \]

几何分布¶

当 \(r = 1\)，有几何分布 \(X\sim G(p)\)

\[ P(X=k) = (1-p)^{k-1} p, k = 1,2,\cdots \]

Poisson 分布¶

Poisson 定理：设 \(\lim\limits_{n\to+\infty}np_n = \lambda > 0\)，则

\[ \lim_{n\to+\infty}\mathrm C_n^k p_n^k (1-p_n)^{n-k} = \mathrm e^{-\lambda} \dfrac{\lambda^k}{k!}, k = 0, 1, 2, \cdots \]
推论：假设 \(np_n = \lambda>0 (n=1,2,\cdots)\)，则上述公式仍成立
二项分布的极限分布是 Poisson 分布：当二项分布 \(n\) 较大而 \(p\) 较小时 (\(n\ge20, p\le0.05\))，有如下近似

\[ P(X>N) = \sum_{k = N+1}^nP(X = k)\approx\sum_{k=N+1}^\infty\mathrm e^{-np}\dfrac{(np)^k}{k!} = 1 - \sum_{0}^{N}\mathrm e^{-np}\dfrac{(np)^k}{k!} \]
Poisson 分布：设随机变量 \(X\) 的所有可能取值为 \(0,1,2,\cdots\)，且分布律为

\[ P(X=k) = \mathrm e^{-\lambda} \dfrac{\lambda^k}{k!}, k = 0,1,2,\cdots \]

其中 \(\lambda>0\)，称 \(X\) 服从参数为 \(\lambda\) 的 Poisson 分布，记为 \(X\sim P(\lambda)\) 或 \(\pi(\lambda)\)

连续型随机变量及其概率密度¶

连续性随机变量的概率密度¶

定义：设 \(X\) 是⼀随机变量，\(F(X)\) 是它的分布函数，若存在一个非负可积函数 \(f(x)\) 使得

\[ F(x) = \int_{-\infty}^xf(t) \mathrm dt,-\infty<x<+\infty \]

则称 \(X\) 为 连续型随机变量，\(f(x)\) 为它的 概率密度函数 (概率密度/密度函数)，\(f(x)\) 可记为 \(f_X(x)\)
分布函数连续
对于一个随机变量 \(X\)，概率密度 \(f(x)\) 不唯一，允许其在有限或者可列无穷多个点处的函数值不同
性质
1. 非负性 \(f(x)\ge0\)
2. 规范性 \(\displaystyle \int_{-\infty}^{+\infty}f(x) \mathrm dx = F(+\infty) = 1\)
3. 在 \(f(x)\) 的连续点 \(x\) 处，有 \(f(x) = F'(x)\)
4. \(f(x)\) 描述了 \(X\) 在 \(x_0\) 附近单位长度的区间内取值的概率，即 \(P(x_0<X\le x_0+\Delta x)\approx f(x_0) \Delta x\)
5. 若 \(a\) 是随机变量 \(X\) 的⼀个可能的取值，则 \(P(X = a) = 0\)
6. 对任意实数 \(a,b (a<b)\)，有
\[ \begin{aligned} P(a < X \le b) &= P(a \le X \le b) = P(a < X < b)\\ &= P(a\le X < b) = \int_a^bf(x) \mathrm dx\\ P(X\le b) &= P(X<b) = \int_{-\infty}^bf(x) \mathrm dx\\ P(X>a) &= P(X\ge a) = \int_a^{+\infty}f(x) \mathrm dx \end{aligned} \]

常见连续型随机变量的分布¶

均匀分布¶

\(X\) 服从区间 \((a,b)\) 上的 均匀分布，记为 \(X\sim U(a,b)\)

密度函数

\[ f(x) = \begin{cases}\dfrac{1}{b-a},&a<x<b,\\0,&\rm otherwise.\end{cases} \]

分布函数

\[ F(X) = \begin{cases}0, &x<a,\\\dfrac{x-a}{b-a},&a\le x<b,\\1,&x\ge b.\end{cases} \]

指数分布¶

\(X\) 服从参数为 \(\lambda\) 的 指数分布，记为 \(X\sim E(\lambda)\)

密度函数

\[ f(x) = \begin{cases}\lambda \mathrm e^{-\lambda x},&x>0,\\0,&x\le 0.\\\end{cases} \]

分布函数

\[ F(x) = \begin{cases}0,&x<0,\\1-\mathrm e^{-\lambda x},&x\ge 0.\end{cases} \]

对任意 \(0<a<b\)，

\[ P(a<X<b) = \mathrm e^{-\lambda a} - \mathrm e^{-\lambda b} \]

指数分布的 无记忆性：若 \(X\sim E(\lambda)\)，则已经用了 \(s\) 小时，还能用 \(t\) 小时的概率为

\[ P(X>s+t \mid X>s) = P(X>t) \]
泊松分布与指数分布关系：一段时间内顾客来的概率服从泊松分布，则时间间隔服从指数分布

正态分布 (Gaussian 分布)¶

\(X\) 服从参数为 \(\mu,\sigma\) 的 正态分布，记为 \(X\sim N(\mu, \sigma^2)\)

密度函数

\[ f(x) = \dfrac{1}{\sqrt{2\pi} \sigma}\exp (-\dfrac{(x-\mu)^2}{2\sigma^2}),\quad-\infty<x<+\infty \]

性质
1. 直线关于 \(x=\mu\) 对称：\(f(\mu + x) = f(\mu - x)\)
2. 最大值 \(f(\mu) = \dfrac{1}{\sqrt{2\pi} \sigma}\)
3. 渐近线 \(x\) 轴
4. 拐点 \(x=\mu\pm\sigma\)
5. \(\sigma\) 形状参数
  - 与曲线陡峭程度成反比
  - 与数据分散程度成正比
6. \(\mu\) 位置参数
  - 对称轴的位置

标准正态分布¶

\(X^*\sim N(0,1)\) 为 标准正态分布

密度函数

\[ \varphi(x) = \dfrac{1}{\sqrt{2\pi}} \mathrm e^{-\frac{x^2}{2}},\quad-\infty<x<+\infty \]

分布函数

\[ \mathit\Phi(x) = \dfrac{1}{\sqrt{2\pi}}\int_{-\infty}^x\mathrm e^{-\frac{t^2}{2}} \mathrm dt,\quad-\infty<x<+\infty \]

性质：
- \(\mathit\Phi(-x) = 1-\mathit\Phi(x)\)
- \(P(| X^* |\le a) = 2 \mathit\Phi(a)-1\)
- 一般正态分布可以由线性变换 \(Y=\dfrac{X-\mu}{\sigma}\) 转化为标准正态分布：若 \(X\sim N(\mu, \sigma^2)\)，则 \(X^* = \dfrac{X-\mu}{\sigma}\)
- 一般正态分布概率的计算可以转化为标准正态分布的概率来计算：若 \(X\sim N(\mu, \sigma^2)\)，则 \(F(x) = \mathit\Phi\left(\dfrac{x-\mu}{\sigma}\right)\)

随机变量函数的分布¶

离散型随机变量函数的分布¶

列出 \(X\) 的分布律
直接由 \(X\) 的取值确定 \(Y= g(X)\) 的全部可能取值
直接由 \(P(X_i)\) 得到 \(P(Y_i = g(X_i))\)，于是有 \(Y\) 的分布律

连续型随机变量的分布¶

由分布函数定义 \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
对上式变换，若函数 \(g(x)\) 在 \((-\infty, +\infty)\) 内严格单调递增，则 \(F_Y(y) =P(X \le g^{-1}(y)) = F_X(g^{-1}(y))\)
- 如果严格单调递减，则 \(F_Y(y) = P(X \ge g^{-1}(y)) = 1 - F_X(g^{-1}(y))\)
- 如果不严格单调，则用区间表示，比如平方会对应 \(P(X^2 \le y) = P(-\sqrt y \le X \le \sqrt y)\)
将 \(g^{-1}(y)\) 作为自变量代入 \(F(x)\)，得到上式左边的 \(F_Y(y)\)
对 \(F_Y(x)\) 求导得到 \(y\) 的密度函数 \(f_Y(x)\)

一般性定理¶

设随机变量 \(X\) 具有概率密度 \(f_X(x),-\infty < x < +\infty\)，\(g(x)\) 为 \((-\infty, +\infty)\) 内的严格单调的可导函数，则随机变量 \(Y = g(X)\) 的概率密度为

\[ f_Y(y) = \begin{cases}| h'(y) |\cdot f_X[ h(y) ],&\alpha<y < \beta,\\0,&\text{otherwise.}\end{cases} \]

其中：

\(h(y)\) 是 \(g(x)\) 的反函数
\(\alpha = \min\{g(-\infty), g(+\infty)\}, \beta = \max\{g(-\infty), g(+\infty)\}\)

第二章 随机变量及其分布¶