第二章 随机变量及其分布¶
随机变量及其分布函数¶
随机变量¶
-
定义:设随机试验的样本空间是 \(\mathit \Omega\), 若 \(\forall\omega\in\mathit\Omega\), 按⼀定的法则, 存在⼀个实数 \(X(\omega)\) 与之对应, 则称 \(\mathit\Omega\) 上的实值单值函数 \(X(\omega)\) 为 随机变量
-
\(X\) 为 \(\mathit\Omega\to\mathbb R\) 的一个映射
- 定义域为样本空间
- 随机性:可能取值不止一个, 试验前只知道所有可能取值, 但不知道具体哪一个
- 概率特性:随机变量以一定概率取某个值或某些值
随机变量的分布函数¶
-
定义:设 \(X\) 为一随机变量, 对于任意实数 \(x\), 则 \(X\) 的 分布函数 为:
\[ F(x) = P\ (X\le x),\quad-\infty<x<+\infty \]有时记作 \(F_X(x)\)
-
性质:
-
\(F(x)\) 单调不减
\[ \forall x_1<x_2, F(x_1)\le F(x_2) \] -
\(0\le F(x) \le 1\), 且
\[ \lim_{x\to+\infty}F(x) = 1,\lim_{x\to-\infty}F(x) = 0 \]
-
-
用分布函数表示概率
\[ \begin{aligned} P(X\le x_0) &= F(x_0)\\ P(X<x_0) &=\lim_{\Delta x\to0_+}P(X\le x_0-\Delta x)\\ &=\lim_{\Delta x\to0_+}F(x_0-\Delta x)\\ &=F(x_0-0)\\ P(X=x_0) &= F(x_0) - F(x_0-0)\\ P(a<X\le b) &= F(b) - F(a) \end{aligned} \]
离散型随机变量及其分布律¶
离散型随机变量概率分布¶
- 定义:随机变量 \(X\) 的可能取值是有限个或可列无穷多个
- 分布律:设离散型随机变量 \(X\) 的所有可能取值为 \(X=x_k\ (k=1,2,\cdots)\), 不妨设 \(x_1<x_2<\cdots\), 则 \(X\) 的分布律为
-
性质:
-
\[ p_k\ge0, \ k = 1,2,\cdots \]
-
\[ \sum_{k=1}^{+\infty}p_k = 1 \]
-
-
分布函数:
-
\[ F(x) = P(X\le x)=\sum_{x_k\le x}P(X=x_k) \]
-
\[ P(X = x_k) = p_k = P(x_{k-1}<X\le x_k) = F(x_k) - F(x_{k-1}) \]
-
\(F(x)\) 为分段阶梯函数
- 在 \(X\) 的可能取值处存在第一类跳跃间断点
-
常见离散型随机变量¶
0-1 分布 (两点分布)¶
随机变量只有两个可能取值, 分布律由下表所示
其中 \(0<p<1\), 称 \(X\) 服从参数为 \(p\) 的 0-1 分布
也可写成
二项分布 (伯努利概型)¶
-
\(n\) 重 Bernoulli 试验:
- 可独立地进行 \(n\) 次 (可能性互不影响)
- 每次试验的结果仅两个, \(A\) 和 \(\overline A\)
对应的概型为 Bernoulli 概型
-
\(n\) 重 Bernoulli 试验中, 设一次试验中事件 \(A\) 发生的概率为 \(P(A) = p\ (0<p<1)\), 则事件 \(A\) 发生次数 \(X\) 的分布律为
\[ P(X=k) = \mathrm C_n^k\ p^k\ (1-p)^{n-k}, \ k = 0, 1, \cdots, n \] -
称 \(X\) 服从参数为 \((n,p)\) 的 二项分布, 记为 \(X\sim B(n,p)\)
\[ P(X>N) = \sum_{k = N+1}^nP(X = k) \] -
超几何分布的极限分布是二项分布
负二项分布 (Pascal 分布)¶
进行一个试验直到成功 \(r\) 次, 试验进行了 \(k\) 次的分布律
几何分布¶
当 \(r = 1\), 有几何分布 \(X\sim G(p)\)
-
求出最可能出现的次数
\[ \begin{cases} \dfrac{P_{k-1}}{P_k} = \dfrac{(1-p)\ k}{p\ (n-k+1)}\le1,\\ \dfrac{P_k}{P_{k+1}} = \dfrac{(1-p)\ (k+1)}{p\ (n-k)}\ge1, \end{cases} \implies(n+1)\ p-1\le k \le (n+1)\ p \]
Poisson 分布¶
-
Poisson 定理:设 \(\lim\limits_{n\to+\infty}np_n = \lambda > 0\), 则
\[ \lim_{n\to+\infty}\mathrm C_n^k\ p_n^k\ (1-p_n)^{n-k} = \mathrm e^{-\lambda}\ \dfrac{\lambda^k}{k!},\ k = 0, 1, 2, \cdots \] -
推论:假设 \(np_n = \lambda>0\ (n=1,2,\cdots)\), 则上述公式仍成立
-
二项分布的极限分布是 Poisson 分布:当二项分布 \(n\) 较大而 \(p\) 较小时 (\(n\ge20, p\le0.05\)), 有如下近似
\[ P(X>N) = \sum_{k = N+1}^nP(X = k)\approx\sum_{k=N+1}^\infty\mathrm e^{-np}\dfrac{(np)^k}{k!} = 1 - \sum_{0}^{N}\mathrm e^{-np}\dfrac{(np)^k}{k!} \] -
Poisson 分布:设随机变量 \(X\) 的所有可能取值为 \(0,1,2,\cdots\), 且分布律为
\[ P(X=k) = \mathrm e^{-\lambda}\ \dfrac{\lambda^k}{k!},\ k = 0,1,2,\cdots \]其中 \(\lambda>0\),称 \(X\) 服从参数为 \(\lambda\) 的 Poisson 分布, 记为 \(X\sim P(\lambda)\) 或 \(\pi(\lambda)\)
连续型随机变量及其概率密度¶
连续性随机变量的概率密度¶
-
定义:设 \(X\) 是⼀随机变量, \(F(X)\) 是它的分布函数, 若存在一个非负可积函数 \(f(x)\) 使得
\[ F(x) = \int_{-\infty}^xf(t)\ \mathrm dt,-\infty<x<+\infty \]则称 \(X\) 为 连续型随机变量, \(f(x)\) 为它的 概率密度函数 (概率密度/密度函数), \(f(x)\) 可记为 \(f_X(x)\)
-
分布函数连续
- 对于一个随机变量 \(X\), 概率密度 \(f(x)\) 不唯一, 允许其在有限或者可列无穷多个点处的函数值不同
-
性质
- 非负性 \(f(x)\ge0\)
- 规范性 \(\displaystyle \int_{-\infty}^{+\infty}f(x)\ \mathrm dx = F(+\infty) = 1\)
- 在 \(f(x)\) 的连续点 \(x\) 处, 有 \(f(x) = F'(x)\)
- \(f(x)\) 描述了 \(X\) 在 \(x_0\) 附近单位长度的区间内取值的概率, 即 \(P(x_0<X\le x_0+\Delta x)\approx f(x_0)\ \Delta x\)
- 若 \(a\) 是随机变量 \(X\) 的⼀个可能的取值, 则 \(P(X = a) = 0\)
- 对任意实数 \(a,b\ (a<b)\), 有
\[ \begin{aligned} P(a < X \le b) &= P(a \le X \le b) = P(a < X < b)\\ &= P(a\le X < b) = \int_a^bf(x)\ \mathrm dx\\ P(X\le b) &= P(X<b) = \int_{-\infty}^bf(x)\ \mathrm dx\\ P(X>a) &= P(X\ge a) = \int_a^{+\infty}f(x)\ \mathrm dx \end{aligned} \]
常见连续型随机变量的分布¶
均匀分布¶
\(X\) 服从区间 \((a,b)\) 上的 均匀分布, 记为 \(X\sim U(a,b)\)
- 密度函数
- 分布函数
指数分布¶
\(X\) 服从参数为 \(\lambda\) 的 指数分布, 记为 \(X\sim E(\lambda)\)
- 密度函数
- 分布函数
- 对任意 \(0<a<b\),
-
指数分布的 无记忆性:若 \(X\sim E(\lambda)\),则已经用了 \(s\) 小时, 还能用 \(t\) 小时的概率为
\[ P(X>s+t\ |\ X>s) = P(X>t) \] -
泊松分布与指数分布关系:一段时间内顾客来的概率服从泊松分布, 则时间间隔服从指数分布
正态分布 (Gaussian 分布)¶
\(X\) 服从参数为 \(\mu,\sigma\) 的 正态分布, 记为 \(X\sim N(\mu, \sigma^2)\)
- 密度函数
- 性质
- 直线关于 \(x=\mu\) 对称:\(f(\mu + x) = f(\mu - x)\)
- 最大值 \(f(\mu) = \dfrac{1}{\sqrt{2\pi}\ \sigma}\)
- 渐近线 \(x\) 轴
- 拐点 \(x=\mu\pm\sigma\)
- \(\sigma\) 形状参数
- 与曲线陡峭程度成反比
- 与数据分散程度成正比
- \(\mu\) 位置参数
- 对称轴的位置
标准正态分布¶
\(X^*\sim N(0,1)\) 为 标准正态分布
- 密度函数
- 分布函数
- 性质:
- \(\mathit\Phi(-x) = 1-\mathit\Phi(x)\)
- \(P(|\ X^*\ |\le a) = 2\ \mathit\Phi(a)-1\)
- 一般正态分布可以由线性变换 \(Y=\dfrac{X-\mu}{\sigma}\) 转化为标准正态分布:若 \(X\sim N(\mu, \sigma^2)\), 则 \(X^* = \dfrac{X-\mu}{\sigma}\)
- 一般正态分布概率的计算可以转化为标准正态分布的概率来计算:若 \(X\sim N(\mu, \sigma^2)\), 则 \(F(x) = \mathit\Phi\left(\dfrac{x-\mu}{\sigma}\right)\)
随机变量函数的分布¶
离散型随机变量函数的分布¶
- 列出 \(X\) 的分布律
- 直接由 \(X\) 的取值确定 \(Y= g(X)\) 的全部可能取值
- 直接由 \(P(X_i)\) 得到 \(P(Y_i = g(X_i))\), 于是有 \(Y\) 的分布律
连续型随机变量的分布¶
- 由分布函数定义 \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
- 对上式变换, \(=P(X \le g^{-1}(y)) = F(g^{-1}(y))\)
- 这里有可能会有平方, 变成 \(P(X^2 \le y) = P(-\sqrt y \le X \le \sqrt y)\)
- 将 \(g^{-1}(y)\) 作为自变量代入 \(F(x)\), 得到上式左边的 \(F_Y(y)\)
- 对 \(F_Y(x)\) 求导得到 \(y\) 的密度函数 \(f_Y(x)\)
一般性定理¶
设随机变量 \(X\) 具有概率密度 \(f_X(x),-\infty < x < +\infty\),\(g(x)\) 为 \((-\infty, +\infty)\) 内的严格单调的可导函数,则随机变量 \(Y = g(X)\) 的概率密度为
其中:
- \(h(y)\) 是 \(g(x)\) 的反函数
- \(\alpha = \min\{g(-\infty), g(+\infty)\}, \beta = \max\{g(-\infty), g(+\infty)\}\)