跳转至

第二章 随机变量及其分布

随机变量及其分布函数

随机变量

  • 定义:设随机试验的样本空间是 \(\mathit \Omega\), 若 \(\forall\omega\in\mathit\Omega\), 按⼀定的法则, 存在⼀个实数 \(X(\omega)\) 与之对应, 则称 \(\mathit\Omega\) 上的实值单值函数 \(X(\omega)\)随机变量

  • \(X\)\(\mathit\Omega\to\mathbb R\) 的一个映射

    • 定义域为样本空间
    • 随机性:可能取值不止一个, 试验前只知道所有可能取值, 但不知道具体哪一个
    • 概率特性:随机变量以一定概率取某个值或某些值

随机变量的分布函数

  • 定义:设 \(X\) 为一随机变量, 对于任意实数 \(x\), 则 \(X\)分布函数 为:

    \[ F(x) = P\ (X\le x),\quad-\infty<x<+\infty \]

    有时记作 \(F_X(x)\)

  • 性质

    • \(F(x)\) 单调不减

      \[ \forall x_1<x_2, F(x_1)\le F(x_2) \]
    • \(0\le F(x) \le 1\), 且

      \[ \lim_{x\to+\infty}F(x) = 1,\lim_{x\to-\infty}F(x) = 0 \]
  • 用分布函数表示概率

    \[ \begin{aligned} P(X\le x_0) &= F(x_0)\\ P(X<x_0) &=\lim_{\Delta x\to0_+}P(X\le x_0-\Delta x)\\ &=\lim_{\Delta x\to0_+}F(x_0-\Delta x)\\ &=F(x_0-0)\\ P(X=x_0) &= F(x_0) - F(x_0-0)\\ P(a<X\le b) &= F(b) - F(a) \end{aligned} \]

离散型随机变量及其分布律

离散型随机变量概率分布

  • 定义:随机变量 \(X\) 的可能取值是有限个或可列无穷多个
  • 分布律:设离散型随机变量 \(X\) 的所有可能取值为 \(X=x_k\ (k=1,2,\cdots)\), 不妨设 \(x_1<x_2<\cdots\), 则 \(X\) 的分布律为
\[ P(X=x_k) = p_k,\ k = 1,2,\cdots \]
  • 性质

    1. \[ p_k\ge0, \ k = 1,2,\cdots \]
    2. \[ \sum_{k=1}^{+\infty}p_k = 1 \]
  • 分布函数

    • \[ F(x) = P(X\le x)=\sum_{x_k\le x}P(X=x_k) \]
    • \[ P(X = x_k) = p_k = P(x_{k-1}<X\le x_k) = F(x_k) - F(x_{k-1}) \]
    • \(F(x)\) 为分段阶梯函数

    • \(X\) 的可能取值处存在第一类跳跃间断点

常见离散型随机变量

0-1 分布 (两点分布)

随机变量只有两个可能取值, 分布律由下表所示

\[ \begin{array}{c|cc} \hline \quad X\quad &\quad 1\quad &\quad 0\quad\\ \hline P&p&1-p\\ \hline \end{array} \]

其中 \(0<p<1\), 称 \(X\) 服从参数为 \(p\)0-1 分布

也可写成

\[ P(X=k)=p^k\ (1-p)^{1-k},\ k = 0,1 \]

二项分布 (伯努利概型)

  • \(n\) 重 Bernoulli 试验

    1. 可独立地进行 \(n\) 次 (可能性互不影响)
    2. 每次试验的结果仅两个, \(A\)\(\overline A\)

    对应的概型为 Bernoulli 概型

  • \(n\) 重 Bernoulli 试验中, 设一次试验中事件 \(A\) 发生的概率为 \(P(A) = p\ (0<p<1)\), 则事件 \(A\) 发生次数 \(X\) 的分布律为

    \[ P(X=k) = \mathrm C_n^k\ p^k\ (1-p)^{n-k}, \ k = 0, 1, \cdots, n \]
  • \(X\) 服从参数为 \((n,p)\)二项分布, 记为 \(X\sim B(n,p)\)

    \[ P(X>N) = \sum_{k = N+1}^nP(X = k) \]
  • 超几何分布的极限分布是二项分布

负二项分布 (Pascal 分布)

进行一个试验直到成功 \(r\) 次, 试验进行了 \(k\) 次的分布律

\[ P(X=k) = \mathrm C_{r-1}^{k-1}\ p^r\ (1-p)^{k-r},\ k = r, r+1, \cdots \]

几何分布

\(r = 1\), 有几何分布 \(X\sim G(p)\)

\[ P(X=k) = (1-p)^{k-1}\ p,\ k = 1,2,\cdots \]
  • 求出最可能出现的次数

    \[ \begin{cases} \dfrac{P_{k-1}}{P_k} = \dfrac{(1-p)\ k}{p\ (n-k+1)}\le1,\\ \dfrac{P_k}{P_{k+1}} = \dfrac{(1-p)\ (k+1)}{p\ (n-k)}\ge1, \end{cases} \implies(n+1)\ p-1\le k \le (n+1)\ p \]

Poisson 分布

  • Poisson 定理:设 \(\lim\limits_{n\to+\infty}np_n = \lambda > 0\), 则

    \[ \lim_{n\to+\infty}\mathrm C_n^k\ p_n^k\ (1-p_n)^{n-k} = \mathrm e^{-\lambda}\ \dfrac{\lambda^k}{k!},\ k = 0, 1, 2, \cdots \]
  • 推论:假设 \(np_n = \lambda>0\ (n=1,2,\cdots)\), 则上述公式仍成立

  • 二项分布的极限分布是 Poisson 分布:当二项分布 \(n\) 较大而 \(p\) 较小时 (\(n\ge20, p\le0.05\)), 有如下近似

    \[ P(X>N) = \sum_{k = N+1}^nP(X = k)\approx\sum_{k=N+1}^\infty\mathrm e^{-np}\dfrac{(np)^k}{k!} = 1 - \sum_{0}^{N}\mathrm e^{-np}\dfrac{(np)^k}{k!} \]
  • Poisson 分布:设随机变量 \(X\) 的所有可能取值为 \(0,1,2,\cdots\), 且分布律为

    \[ P(X=k) = \mathrm e^{-\lambda}\ \dfrac{\lambda^k}{k!},\ k = 0,1,2,\cdots \]

    其中 \(\lambda>0\),称 \(X\) 服从参数为 \(\lambda\)Poisson 分布, 记为 \(X\sim P(\lambda)\)\(\pi(\lambda)\)

连续型随机变量及其概率密度

连续性随机变量的概率密度

  • 定义:设 \(X\) 是⼀随机变量, \(F(X)\) 是它的分布函数, 若存在一个非负可积函数 \(f(x)\) 使得

    \[ F(x) = \int_{-\infty}^xf(t)\ \mathrm dt,-\infty<x<+\infty \]

    则称 \(X\)连续型随机变量\(f(x)\) 为它的 概率密度函数 (概率密度/密度函数), \(f(x)\) 可记为 \(f_X(x)\)

  • 分布函数连续

  • 对于一个随机变量 \(X\), 概率密度 \(f(x)\) 不唯一, 允许其在有限或者可列无穷多个点处的函数值不同
  • 性质

    1. 非负性 \(f(x)\ge0\)
    2. 规范性 \(\displaystyle \int_{-\infty}^{+\infty}f(x)\ \mathrm dx = F(+\infty) = 1\)
    3. \(f(x)\) 的连续点 \(x\) 处, 有 \(f(x) = F'(x)\)
    4. \(f(x)\) 描述了 \(X\)\(x_0\) 附近单位长度的区间内取值的概率, 即 \(P(x_0<X\le x_0+\Delta x)\approx f(x_0)\ \Delta x\)
    5. \(a\) 是随机变量 \(X\) 的⼀个可能的取值, 则 \(P(X = a) = 0\)
    6. 对任意实数 \(a,b\ (a<b)\), 有
    \[ \begin{aligned} P(a < X \le b) &= P(a \le X \le b) = P(a < X < b)\\ &= P(a\le X < b) = \int_a^bf(x)\ \mathrm dx\\ P(X\le b) &= P(X<b) = \int_{-\infty}^bf(x)\ \mathrm dx\\ P(X>a) &= P(X\ge a) = \int_a^{+\infty}f(x)\ \mathrm dx \end{aligned} \]

常见连续型随机变量的分布

均匀分布

\(X\) 服从区间 \((a,b)\) 上的 均匀分布, 记为 \(X\sim U(a,b)\)

  • 密度函数
\[ f(x) = \begin{cases}\dfrac{1}{b-a},&a<x<b,\\0,&\rm otherwise.\end{cases} \]
  • 分布函数
\[ F(X) = \begin{cases}0, &x<a,\\\dfrac{x-a}{b-a},&a\le x<b,\\1,&x\ge b.\end{cases} \]

指数分布

\(X\) 服从参数为 \(\lambda\)指数分布, 记为 \(X\sim E(\lambda)\)

  • 密度函数
\[ f(x) = \begin{cases}\lambda\ \mathrm e^{-\lambda\ x},&x>0,\\0,&x\le 0.\\\end{cases} \]
  • 分布函数
\[ F(x) = \begin{cases}0,&x<0,\\1-\mathrm e^{-\lambda\ x},&x\ge 0.\end{cases} \]
  • 对任意 \(0<a<b\)
\[ P(a<X<b) = \mathrm e^{-\lambda a} - \mathrm e^{-\lambda b} \]
  • 指数分布的 无记忆性:若 \(X\sim E(\lambda)\),则已经用了 \(s\) 小时, 还能用 \(t\) 小时的概率为

    \[ P(X>s+t\ |\ X>s) = P(X>t) \]
  • 泊松分布与指数分布关系:一段时间内顾客来的概率服从泊松分布, 则时间间隔服从指数分布

正态分布 (Gaussian 分布)

\(X\) 服从参数为 \(\mu,\sigma\)正态分布, 记为 \(X\sim N(\mu, \sigma^2)\)

  • 密度函数
\[ f(x) = \dfrac{1}{\sqrt{2\pi}\ \sigma}\exp (-\dfrac{(x-\mu)^2}{2\sigma^2}),\quad-\infty<x<+\infty \]
  • 性质
    1. 直线关于 \(x=\mu\) 对称:\(f(\mu + x) = f(\mu - x)\)
    2. 最大值 \(f(\mu) = \dfrac{1}{\sqrt{2\pi}\ \sigma}\)
    3. 渐近线 \(x\)
    4. 拐点 \(x=\mu\pm\sigma\)
    5. \(\sigma\) 形状参数
      • 与曲线陡峭程度成反比
      • 与数据分散程度成正比
    6. \(\mu\) 位置参数
      • 对称轴的位置

标准正态分布

\(X^*\sim N(0,1)\)标准正态分布

  • 密度函数
\[ \varphi(x) = \dfrac{1}{\sqrt{2\pi}}\ \mathrm e^{-\frac{x^2}{2}},\quad-\infty<x<+\infty \]
  • 分布函数
\[ \mathit\Phi(x) = \dfrac{1}{\sqrt{2\pi}}\int_{-\infty}^x\mathrm e^{-\frac{t^2}{2}}\ \mathrm dt,\quad-\infty<x<+\infty \]
  • 性质
    • \(\mathit\Phi(-x) = 1-\mathit\Phi(x)\)
    • \(P(|\ X^*\ |\le a) = 2\ \mathit\Phi(a)-1\)
    • 一般正态分布可以由线性变换 \(Y=\dfrac{X-\mu}{\sigma}\) 转化为标准正态分布:若 \(X\sim N(\mu, \sigma^2)\), 则 \(X^* = \dfrac{X-\mu}{\sigma}\)
    • 一般正态分布概率的计算可以转化为标准正态分布的概率来计算:若 \(X\sim N(\mu, \sigma^2)\), 则 \(F(x) = \mathit\Phi\left(\dfrac{x-\mu}{\sigma}\right)\)

随机变量函数的分布

离散型随机变量函数的分布

  1. 列出 \(X\) 的分布律
  2. 直接由 \(X\) 的取值确定 \(Y= g(X)\) 的全部可能取值
  3. 直接由 \(P(X_i)\) 得到 \(P(Y_i = g(X_i))\), 于是有 \(Y\) 的分布律

连续型随机变量的分布

  1. 由分布函数定义 \(F_Y(y) = P(Y \le y) = P(g(X) \le y)\)
  2. 对上式变换, \(=P(X \le g^{-1}(y)) = F(g^{-1}(y))\)
    • 这里有可能会有平方, 变成 \(P(X^2 \le y) = P(-\sqrt y \le X \le \sqrt y)\)
  3. \(g^{-1}(y)\) 作为自变量代入 \(F(x)\), 得到上式左边的 \(F_Y(y)\)
  4. \(F_Y(x)\) 求导得到 \(y\) 的密度函数 \(f_Y(x)\)

一般性定理

设随机变量 \(X\) 具有概率密度 \(f_X(x),-\infty < x < +\infty\)\(g(x)\)\((-\infty, +\infty)\) 内的严格单调的可导函数,则随机变量 \(Y = g(X)\) 的概率密度为

\[ f_Y(y) = \begin{cases}|\ h'(y)\ |\cdot f_X[\ h(y)\ ],&\alpha<y < \beta,\\0,&\text{otherwise.}\end{cases} \]

其中:

  • \(h(y)\)\(g(x)\) 的反函数
  • \(\alpha = \min\{g(-\infty), g(+\infty)\}, \beta = \max\{g(-\infty), g(+\infty)\}\)