跳转至

第四章 随机变量的数字特征

数学期望

数学期望的概念

  • 离散型随机变量的期望:设 离散型 随机变量 \(X\) 的分布律为 \(P\left(X=x_{k}\right)=p_{k},\quad k=1,2,\cdots\),若级数 \(\displaystyle\sum_{k=1}^{+\infty} x_{k} p_{k}\) 绝对收敛,即 \(\displaystyle\sum_{k=1}^{+\infty}\left|x_{k}\right| p_{k}<+\infty\),则随机变量 \(X\)数学期望 (均值) 为

    \[ E(X) = \sum_{k=1}^{+\infty} x_{k} p_{k} \]
    • 若级数不绝对收敛,则数学期望不存在
  • 连续型随机变量的期望:设 \(X\)连续型 随机变量,其概率密度为 \(f(x)\)\(\displaystyle\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x\) 绝对收敛,即 \(\displaystyle\int_{-\infty}^{+\infty}|x| f(x) \mathrm{d} x<+\infty\),则随机变量 \(X\)数学期望 (均值) 为

    \[ E(X) =\int_{-\infty}^{+\infty} x f(x) \mathrm{d} x \]

数学期望的性质

  • 存在性充要条件:设 \(X\) 是任意随机变量,则 \(X\) 的数学期望存在的充要条件是

    \[ E(|\ X\ |)<+\infty \]
  • 有序性:设 \(X,Y\) 是任意两个数学期望存在的随机变量,且 \(X\le Y\),则

    \[ E(X) \le E(Y) \]
    • 若存在数 \(a\) 使得 \(P(X\ge a) = 1\),则

      \[ E(X)\ge a \]
    • 若存在数 \(b\) 使得 \(P(X\le b) = 1\),则

      \[ E(X)\le b \]
  • 线性性

    • \(X\) 是任意满足 \(E(|\ X\ |)<+\infty\) 的随机变量,\(C\) 是任意常数,则

      \[ E(C X)=C E(X) \]
    • \(X,Y\)任意 两个数学期望存在的随机变量,则 \(X+Y\) 的数学期望也存在,且

      \[ E(X+Y)=E(X)+E(Y) \]
  • 正向可乘性:设 \(X,Y\)相互独立 的两个数学期望存在的随机变量,则 \(XY\) 的数学期望也存在,且

    \[ E(X Y)=E(X)\ E(Y) \]
  • 柯西-施瓦茨不等式

    \[ E^{2}(X Y) \leq E\left(X^{2}\right) E\left(Y^{2}\right) \]

    \(E\left(X^{2}\right)>0,E\left(Y^{2}\right)>0\),iff \(P\left(Y=t_{0} X\right)=1\) 时,等式成立

随机变量函数的数学期望

一维随机变量

\(X\) 为随机变量,\(Y=g(X)\),其中 \(g(x)\) 是一个确定函数

  • 离散型:设 \(X\) 为离散型随机变量,其分布律为 \(P\left(X=x_{k}\right)=p_{k},k=1,2,\cdots\),若级数 \(\displaystyle\sum_{k=1}^{+\infty} g\left(x_{k}\right) p_{k}\) 绝对收敛,则

    \[ E(Y)=E\big(g(X)\big)=\sum_{k=1}^{+\infty} g\left(x_{k}\right)\ p_{k} \]
  • 连续型:设 \(X\) 为连续型随机变量,其概率密度为 \(f(x)\),若积分 \(\displaystyle\int_{-\infty}^{+\infty} g(x) f(x) \mathrm{d} x\) 绝对收敛,则

    \[ E(Y)=E\big(g(X)\big)=\int_{-\infty}^{+\infty} g(x)\ f(x)\ \mathrm{d} x \]

二维随机变量

\(X,Y\) 为随机变量,\(Z=g(X,Y)\),其中 \(g(x,y)\) 是一个确定函数

  • 离散型:设 \((X,Y)\) 为离散型随机变量,其分布律为 \(P\left(X=x_{i},Y = y_j\right)=p_{ij},i,j=1,2,\cdots\),若级数 \(\displaystyle\sum_{i=1}^{+\infty} \sum_{j=1}^{+\infty} g\left(x_{i},y_{j}\right) p_{i j}\) 绝对收敛,则

    \[ E(Z)=E\big(g(X,Y)\big)=\sum_{i=1}^{+\infty} \sum_{j=1}^{+\infty} g\left(x_{i},y_{j}\right)\ p_{i j} \]
  • 连续型:设 \((X,Y)\) 为连续型随机变量,其联合概率密度为 \(f(x,y)\),若积分 \(\displaystyle\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) f(x,y) \ \mathrm{d} x \ \mathrm{d} y\) 绝对收敛,则

    \[ E(Z)=E\big(g(X,Y)\big)=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} g(x,y) \ f(x,y) \ \mathrm{d} x \ \mathrm{d} y \]

方差

方差的概念

\(X\) 是一个随机变量,若 \(E\left\{[X-E(X)]^{2}\right\}\) 存在,则称其为 \(X\)方差,记为 \(D(X)\)\(Var(X)\),即

\[ \begin{aligned} D(X)&=E\left\{[X-E(X)]^{2}\right\}\\ &=E\left(X^{2}\right)-[E(X)]^{2} \end{aligned} \]
  • 离散型:设 \(X\)离散型 随机变量,其分布律为 \(P\left(X=x_{i}\right)=p_{i},i=1,2,\cdots\),则

    \[ D(X)=\sum_{i=1}^{+\infty}\left[x_{i}-E(X)\right]^{2} p_{i} \]
  • 连续型:设 \(X\)连续型 随机变量,其概率密度为 \(f(x)\),则

    \[ D(X)=\int_{-\infty}^{+\infty}[x-E(X)]^{2} f(x) \mathrm{d} x \]

方差的性质

  • 平方线性

    \[ D(aX+b)=a^2 D(X) \]
  • 常值函数的方差为零

    \[ D(C) = 0 \]
  • 两方差相加

    \[ \begin{aligned} D(X \pm Y) &=D(X)+D(Y) \pm 2 E((X-E(X))(Y-E(Y)))\\ &=D(X)+D(Y) \pm 2 (E(XY)-E(X)E(Y))\\ &=D(X)+D(Y) \pm 2 \operatorname{Cov}(X, Y) \end{aligned} \]
  • 相互独立的随机变量相加

    \[ D(X\pm Y)=D(X)+D(Y) \]
    • 逆命题不成立
    • 事实上, 对于任意随机变量, \(D(X\pm Y) = D(X) \pm 2\mathrm{Cov}(X,Y) + D(Y)\)
    • \(X, Y\) 独立, 则其不相关, 协方差为零
    • 方差定义式与意义的扩展:设 \(X\) 为一个方差存在的随机变量, 则对任意实数 \(C\), 有
    \[ D(X) \leqslant E\left[(X-C)^{2}\right] \]
  • 方差为零的充要条件:设 \(X\) 为一个随机变量, \(C = E(X)\) 为常数

    \[ D(X) = 0\iff P(X=C) = 1 \]

标准化随机变量的方差

对于存在 \(E(X), D(X)>0\) 的任意随机变量 \(X\), 有 标准化随机变量

\[ X^{\star}=\frac{X-E(X)}{\sqrt{D(X)}} \]
  • 期望为 0:\(E(X^*) = 0\)
  • 方差为 1:\(D(X^*) = 1\)
  • 对于 \(X\) 的线性组合 \(Y = aX + b\),则有 \(X^*=Y^*\)

常见分布的期望与方差

分布 分布律 期望 方差
\(0-1\) 分布
\(B(1, p)\)
\(P(X = k) = p^k\ (1-p)^{1-k}\)
\(k=0, 1,\quad 0<p<1\)
\(p\) \(p\ (1-p)\)
二项分布
\(B(n,p)\)
\(P(X = k) = \mathrm C_n^k\ p^k\ (1-p)^{n-k}\)
\(k=0,1,\cdots,n,\quad 0<p<1\)
\(np\) \(np\ (1-p)\)
泊松分布
\(P(\lambda)\)
\(P(X=k) = \mathrm e^{-\lambda}\ \dfrac{\lambda^k}{k!}\)
\(k = 0,1,2,\cdots,\quad \lambda >0\)
\(\lambda\) \(\lambda\)
几何分布
\(G(p)\)
\(P(X=k)=(1-p)^{k-1} p\)
\(k=1,2, \cdots,\quad 0<p<1\)
\(\dfrac1p\) \(\dfrac1{p^2} - \dfrac1p\)
超几何分布
\(H(n, M, N)\)
\(P(X = k) = \dfrac{\mathrm C_M^k\ \mathrm C_{N-M}^{n-k}}{\mathrm C_N^n}\)
\(k=0,1,\cdots,\min(M,n)\)
\(0\le M\le N\)
\(\dfrac{nM}{N}\) \(\dfrac{nM(N-M)}{N^2(N-1)}\)
负二项分布
(Pascal 分布)
\(P(X = k) = \mathrm C_{k-1}^{r-1}\ p^r\ (1-p)^{k-r}\)
\(k=r,r+1,\cdots,\quad 0<p<1\)
\(\dfrac rp\) \(r\left(\dfrac1{p^2} - \dfrac1p\right)\)
均匀分布
\(U(a,b)\)
\(\displaystyle f(x) = \begin{cases}\dfrac{1}{b-a}, &a<x<b,\\0, &\text{otherwise}.\end{cases}\) \(\dfrac{a+b}{2}\) \(\dfrac{(b-a)^2}{12}\)
指数分布
\(E(\lambda)\)
\(f(x) = \begin{cases}\lambda\ \mathrm e^{-\lambda x}, &x>0, \\0,&\text{otherwise}.\end{cases}\) \(\dfrac1\lambda\) \(\dfrac{1}{\lambda^2}\)
正态分布
\(N(\mu, \sigma^2)\)
\(f(x) = \dfrac{1}{\sqrt{2\pi}\sigma}\exp\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)\)
\(-\infty<x<+\infty, -\infty<\mu<\infty,\sigma >0\)
\(\mu\) \(\sigma^2\)

协方差与相关系数

协方差与相关系数的概念

  • 协方差:随机变量 \(X, Y\) 的协方差为

    \[ \mathrm{Cov}(X,Y) = E[(X-E(X))(Y-E(Y))] \]
    • \(D(X) = \mathrm{Cov}(X,X)\)
    • 相关系数:当 \(D(X)>0, D(Y)>0\), 则有 \(X\)\(Y\) 的相关系数
    \[ \rho_{X Y}=\frac{\operatorname{Cov}(X,Y)}{\sqrt{D(X)} \sqrt{D(Y)}} \]
    • 相关系数为标准化的协方差 \(\rho_{XY} = \mathrm{Cov}(X^*,Y^*)\)
    • \(\rho_{XY} = 0\) 时, \(X\)\(Y\) 不相关
    • 协方差矩阵
    \[ \left(\begin{array}{cc} D(X) & \operatorname{Cov}(X, Y) \\ \operatorname{Cov}(X, Y) & D(Y) \end{array}\right) \]

协方差的计算

  • 定义

    \[ \begin{aligned} \operatorname{Cov}(X,Y)&=E(X Y)-E(X) E(Y)\\ D(X \pm Y)&=D(X)+D(Y) \pm 2 \operatorname{Cov}(X, Y) \end{aligned} \]
  • 离散型

    \[ \operatorname{Cov}(X,Y)=\sum_{i=1}^{+\infty} \sum_{j=1}^{+\infty}\left[x_{i}-E(X)\right]\left[y_{j}-E(Y)\right] p_{i j} \]
  • 连续型

    • \(X, Y\) 的联合概率密度为 \(f(x,y)\),则
    \[ \begin{aligned} \operatorname{Cov}(X,Y)&=E(XY)-E(X)E(Y)\\ &=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} x y f(x,y) \mathrm{d} x \mathrm{d} y - E(X)E(Y)\\ &=\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty}[x-E(X)][y-E(Y)] f(x,y) \mathrm{d} x \mathrm{d} y\\ \end{aligned} \]

协方差的性质

  • 可换性

    \[ \operatorname{Cov}(X,Y)=\operatorname{Cov}(Y,X) \]
  • 变量与常数的协方差

    \[ \operatorname{Cov}(X,C) = 0 \]
  • 变量与自己的协方差为方差

    \[ \mathrm{Cov}(X,X) = D(X) \]
  • 线性性

    \[ \begin{aligned} \operatorname{Cov}(a X,b Y)&=a b \operatorname{Cov}(X,Y)\\ \operatorname{Cov}(X,Y)&=\operatorname{Cov}(X-a,Y-b) \end{aligned} \]
  • 线性可加性

    \[ \operatorname{Cov}(X+Y,Z)=\operatorname{Cov}(X,Z)+\operatorname{Cov}(Y,Z) \]
  • 柯西施瓦茨不等式

    \[ |\operatorname{Cov}(X,Y)| \leqslant \sqrt{D(X)} \sqrt{D(Y)} \]

相关系数的性质

  • 规范性

    \[ \left|\rho_{X Y}\right| \leqslant 1 \]
  • 随机变量完全相关

    \[ \left|\rho_{X Y}\right| = 1\iff P(Y^* = \pm X^*) = 1 \]
    • \(\rho_{X Y}=1 \iff P(Y^* = X^*) = 1\) 此时 \(X,Y\) 完全正相关
    • \(\rho_{X Y}= -1 \iff P(Y^* = -X^*) = 1\) 此时 \(X,Y\) 完全负相关
    • \(|\rho_{XY}|\) 反映了由 \(X\) 的线性函数 \(aX+b\) 估计 \(Y\) 所产生的均方误差的大小
    • 均方误差
    \[ \min\limits_{a,b} E\left\{\left[Y - (a + bX) \right]^2\right\}= E\left\{\left[Y - (a_0 + b_0X) \right]^2\right\}=\left(1 - \rho_{XY}^2\right) D(Y) \]
    • \(b_0 = \dfrac{\mathrm{Cov}(X,Y)}{D(X)}\)
    • \(a_0 = E(Y) - b_0 E(X)\)
    • 均方误差为关于 \(|\ \rho_{XY}\ |\) 的严格递减函数

随机变量的高阶矩

原点矩与中心矩

  • 原点矩:设 \(X,Y\) 都是随机变量,若 \(E\left(|X|^{k}\right)<+\infty(k=1,2,\cdots)\), 则 \(X\)\(\boldsymbol k\) 阶原点矩

    \[ E(X^k) \]
  • 中心矩:设 \(X\) 是一个随机变量,若 \(E\left(|X|^{k}\right)<+\infty(k=1,2,\cdots)\), 则 \(X\)\(\boldsymbol k\) 阶原点矩

    \[ E\{[\ X-E(X)\ ]^k\} \]
  • 混合原点矩与混合中心矩:设 \(X,Y\) 都是随机变量,且 \(E\left(|X|^{k}|Y|^{l}\right)<+\infty(k,l=1,2,\cdots)\), 若 \(E\left(|X|^{k}|Y|^{l}\right)<+\infty(k,l=1,2,\cdots)\), 则

    • \(X,Y\)\(\boldsymbol{k+l}\) 阶混合原点矩

      \[ E\left(X^{k} Y^{l}\right) \]
    • \(X,Y\)\(\boldsymbol{k+l}\) 阶混合中心矩

      \[ E\left\{[X-E(X)]^{k}[Y-E(Y)]^{l}\right\} \]

协方差矩阵

  • 定义:设 \(\left(X_{1},X_{2},\cdots,X_{n}\right)\)\(n\) 维随机变量, 且其分别都存在二阶矩, 记 \(c_{i j}=\operatorname{cov}\left(X_{i},X_{j}\right),i,j=1,2,\cdots,n\), 则 \(n\) 维随机变量的 协方差矩阵
\[ \boldsymbol{C}=\begin{pmatrix} c_{11} & c_{12} & \cdots & c_{1 n} \\ c_{21} & c_{22} & \cdots & c_{2 n} \\ \vdots & \vdots & & \vdots \\ c_{n 1} & c_{n 2} & \cdots & c_{n n} \end{pmatrix} \]
  • 性质
    1. \(\boldsymbol C\) 为对称矩阵, 因为 \(c_{i j}=c_{j i}\)
    2. \(\boldsymbol C\) 为半正定矩阵
    3. 对任意实数 \(t_{1},t_{2},\cdots,t_{n}\)

      \[ D\left(t_{1} X_{1}+t_{2} X_{2}+\cdots+t_{n} X_{n}\right)=\left(t_{1},t_{2},\cdots,t_{n}\right) \boldsymbol{C}\left(\begin{array}{c}t_{1} \\ t_{2} \\ \vdots \\ t_{n}\end{array}\right) \]