跳转至

第三章 多维随机变量及其分布

二维随机变量

二维随机变量及其联合分布函数

  • 定义:设 \(E\) 是⼀个随机试验,\(\mathit \Omega\) 是其样本空间,若对 \(\mathit \Omega\) 中的任意⼀个样本点 \(\omega\) 按照⼀定的对应法则,存在⼀对实数 \(X(\omega),Y(\omega)\) 与之对应,简记为 \((X,Y)\),称之为 二维随机变量

  • 联合分布函数

    \[ F(x,y) = P(\{X\le x\}\cup \{Y\le y\}) = P(X\le x,Y\le y) \]
  • 性质

    1. \(0\le F(x,y)\le 1\),对于任意固定的 \(x,y\),有

      \[ F(-\infty,y) = 0,F(x,-\infty) = 0,F(-\infty,-\infty) = 0,F(+\infty,+\infty) = 1 \]
    2. \(F(x,y)\) 固定其中⼀个变量,它关于另⼀个变量是单调不减的函数

    3. \(F(x,y)\) 固定其中⼀个变量,它关于另⼀个变量是右连续函数

      \[ F(x+0,y) = F(x,y),\quad F(x,y+0) = F(x,y) \]
    4. 对任意实数 \(a<b,c<d\),(图形为一个矩形)

      \[ F(b,d) - F(a,d)-F(b,d) + F(a,c) = P(a<X\le b,c<Y \le d)\ge0 \]
    5. 对于平面右上角的一块无穷区域 \(\bf I\),计算概率时应当将整个平面减去三个区域 \(\bf II,III,IV\)

      \[ \begin{aligned} P(X> a,Y>c) &= P(a<X<+\infty,c<y<+\infty)\\ &=1-F(+\infty,c) - F(a,+\infty)+F(a,c)\\ &\neq 1- F(a,c) \end{aligned} \]
  • 边缘分布函数:设⼆维随机变量 \((X,Y)\) 的分布函数为 \(F(x,y)\),分量 \(X\)\(Y\) 也都是随机变量,各⾃的分布函数分别记为 \(F_X(x),F_Y(y)\),并依次称为随机变量 \((X,Y)\) 关于 \(X,Y\)边缘分布函数

    \[ \begin{aligned} F_X(x) &= P(X\le x) = F(x,+\infty)\\ F_Y(y) &= P(Y\le y) = F(+\infty,y) \end{aligned} \]

二维离散型随机变量

  • 定义:随机变量 \((X,Y)\) 在⼆维平⾯上所有可能的取值为有限对或可列无穷对,则称 \((X,Y)\)⼆维离散型随机变量
  • 设⼆维随机变量 \((X,Y)\) 的所有可能取值为 \((x_i,y_i),i,j = 1,2,\cdots\),则称 \(P(X=x_i,Y=y_i)=p_{ij},i = j = 1,2,\cdots\) 为⼆维离散型随机变量 \((X,Y)\)联合分布律 或联合分布列,简称为 分布律
\[ \begin{array}{c|c|c} \hline P_{ij}& \begin{array}{ccccc}&&X\\ \hline \ x_1&\ x_2\ &\cdots &\ x_i\ &\cdots \end{array} &P_{\bullet j} = \displaystyle\sum_i p_{ij}\\ \hline \begin{array}{c|c}&\;\;\;y_1\\&\;\;\;y_2\\Y\ \ \ &\;\;\;\vdots\\&\;\;\;y_j\\&\;\;\;\vdots\\ \end{array} &\begin{array}{ccccc} p_{11}&p_{21}&\cdots&p_{i1}&\cdots\\ p_{12}&p_{22}&\cdots&p_{i2}&\cdots\\ \vdots&\vdots&&\vdots&\\ p_{1j}&p_{2j}&\cdots&p_{ij}&\cdots\\ \vdots&\vdots&&\vdots&\\ \end{array} &\begin{array}{c} p_{\bullet1}\\p_{\bullet2}\\\vdots\\p_{\bullet j}\\\vdots \end{array}\\ \hline p_{i\bullet} = \displaystyle\sum_{j} p_{ij}& \begin{array}{ccccc} p_{1\bullet}&p_{2\bullet}&\cdots &p_{i\bullet} &\cdots \end{array}& \displaystyle\sum_i\sum_j p_{ij} = 1\\ \hline \end{array} \]
  • 性质:若某数列满足下列性质,则可以作为某个二维离散型随机变量的分布律

    • 非负性
    \[ p_{ij}\ge 0\ (i,j = 1,2,\cdots) \]
    • 规范性
    \[ \sum_i\sum_jp_{ij} = 1 \]

由分布律求分布函数

⼆维离散型随机变量的分布函数与分布律互为确定

\[ (x,y) = \sum_{x_i\le x}\sum_{y_j\le y}p_{ij} \]

二维离散型随机变量的边缘分布律

以下分别为 \((X,Y)\) 关于 \(X\)\(Y\)边缘分布律

\[ \begin{aligned} P(X= x_i) &= \sum_j p_{ij} \xlongequal{记为} p_{i\bullet},\ i=1,2,\cdots\\ P(Y= y_j) &= \sum_i p_{ij} \xlongequal{记为} p_{\bullet j},\ j=1,2,\cdots \end{aligned} \]

二维连续型随机变量

  • 分布函数⼆维连续型随机变量 \((X,Y)\) 的分布函数 \(F(X,Y)\)\((X,Y)\) 的联合概率密度函数 \(f(x,y)\) (⼆元⾮负可积函数) 的二重积分

    \[ F(x,y) = \int_{-\infty}^x\int_{-\infty}^yf(u,v)\ \mathrm du\ \mathrm dv \]
  • 性质

    1. 非负性

      \[ f(x,y)\ge 0,\quad(x,y)\in\mathbb R^2 \]
    2. 规范性

      \[ \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\ \mathrm dy = 1 \]
    3. 样本点落在任一区域 \(D\) 的概率

      \[ P((X,Y)\in D) = \iint\limits_D f(x,y)\ \mathrm dx\ \mathrm dy \]
    4. 根据分布函数求概率密度函数 \(f(x,y)\) 连续点处

      \[ \dfrac{\partial^2F}{\partial x\ \partial y} = f(x,y) \]
  • 边缘概率密度:已知联合分布可以求得边缘分布,反之不能确定

    \[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\\ \end{aligned} \]

常用连续型二维随机变量分布

均匀分布

连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 均匀分布,记为 \((X,Y)\sim U(G)\), 则其概率密度函数为

\[ f(x,y) = \begin{cases}\dfrac{1}{A_G},&(x,y)\in G,\\0,&\text{otherwise}.\end{cases} \]
  • \(A_G\)\(G\) 的面积
二维正态分布

连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 二维正态分布, 记为 \((X,Y)\sim N(\mu_1,\sigma_1^2; \mu_2,\sigma_2^2; \rho)\), 则其概率密度函数为

\[ f(x,y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \left\{-\frac{1}{2\left(1-\rho^{2}\right)}\left[\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-2 \rho \frac{\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right]\right\} \]
  • 二维正态分布的边缘分布为两个独立的一维正态分布

二维随机变量的条件分布

二维离散型随机变量的条件分布

  • 定义:设有⼆维离散型随机变量 \((X,Y)\)

    • 对于固定的 \(j\),若 \(P(Y = y_j)>0\),则 \(\{Y = y_j\}\) 的条件下 \(X\) 的条件分布律

      \[ P(X = x_i\mid Y = y_j) = \dfrac{P(X = x_i,Y = y_j)}{P(Y = y_j)} = \dfrac{p_{ij}}{p_{\bullet j}},\ i = 1,2,\cdots \]
      • \(P(Y = y_j)\) 即边缘分布律:分布律表格中将 \(Y = y_j\) 一列的概率全部相加
        • 对于固定的 \(i\),若 \(P(X = x_i)>0\),则 \(\{X = x_i\}\) 的条件下 \(Y\) 的条件分布律
      \[ P(Y = y_j\mid X = x_i) = \dfrac{P(X = x_i,Y = y_j)}{P(X = x_i)} = \dfrac{p_{ij}}{p_{i\bullet}},\ j = 1,2,\cdots \]
      • \(P(X = x_i)\) 即边缘分布律:分布律表格中将 \(X = x_i\) 一行的概率全部相加
      • 性质
        1. \[ P(X = x_i\mid Y = y_j)\ge 0 \]
    • \[ \displaystyle\sum_iP(X = x_i\mid Y = y_j) = \sum_i\dfrac{p_{ij}}{p_{\bullet j}} =\dfrac{1}{p_{\bullet j}}\sum_ip_{ij} = 1 \]
    • 乘法公式

      \[ P(X = x_i,Y = y_j) = P(Y = y_j)\ P(X = x_i\mid Y = y_j) ,\ i,j = 1,2,\cdots \]
    • 全概率公式

      \[ P(X = x_i) = \sum_j P(Y = y_j)\ P(X = x_i\mid Y= y_j),i = 1,2,\cdots \]

⼆维连续型随机变量的条件分布

  • 定义:设⼆维随机变量 \((X,Y)\) 的联合概率密度为 \(f(x,y)\)\(X,Y\) 的边缘概率密度分别为 \(f_X(x),f_Y(y)\)

    • \(f_Y(y) > 0\)

      • \(\{Y = y\}\) 的条件下 \(X\) 的条件概率密度

        \[ f_{X\ |\ Y} (x\mid y) = \dfrac{f(x,y)}{f_Y(y)},\quad -\infty<x<+\infty \]
      • \(\{Y = y\}\) 的条件下 \(X\) 的条件分布函数

        \[ F_{X\ |\ Y} (x\mid y) = \int_{-\infty}^x\dfrac{f(u,y)}{f_Y(y)}\ \mathrm du,\quad -\infty<x<+\infty \]
    • \(f_X(x) > 0\)

      • \(\{X = x\}\) 的条件下 \(Y\) 的条件概率密度

        \[ f_{Y\ |\ X} (y\mid x) = \dfrac{f(x,y)}{f_X(x)},\quad -\infty<y<+\infty \]
      • \(\{X = x\}\) 的条件下 \(Y\) 的条件分布函数

        \[ F_{Y\ |\ X} (y\mid x) = \int_{-\infty}^y\dfrac{f(x,v)}{f_X(x)}\ \mathrm dv,\quad -\infty<y<+\infty \]
  • 性质

    1. 类似乘法公式

      \[ \begin{aligned} f(x,y) &= f_X(x)\ f_{Y\ |\ X} (y\mid x)\quad f_X(x)>0\\ &= f_Y(y)\ f_{X\ |\ Y} (x\mid y)\quad f_Y(y)>0 \end{aligned} \]
    2. 类似全概率公式

      \[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy = \int_{-\infty}^{+\infty}f_{X\ |\ Y}(x\mid y)\cdot f_Y(y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx = \int_{-\infty}^{+\infty}f_{Y\ |\ X}(y\mid x)\cdot f_X(x)\ \mathrm dx \end{aligned} \]
    3. 类似 Bayes 公式

      \[ \begin{aligned} f_{X \mid Y}(x \mid y)&=\dfrac{f(x,y)}{f_{Y}(y)}=\dfrac{f_{Y \mid X}(y \mid x) \cdot f_{X}(x)}{f_{Y}(y)} \\ f_{Y \mid X}(y \mid x)&=\dfrac{f(x,y)}{f_{X}(x)}=\dfrac{f_{X \mid Y}(x \mid y) \cdot f_{Y}(y)}{f_{X}(x)} \end{aligned} \]

二维随机变量的独立性

  • 定义:相互独立的二维随机变量 \((X,Y)\) 对任意 \(x,y\) 都有

    \[ P(X \le x,Y \le y)=P(X \le x) P(Y \le y) \]
  • 判定独立性

    • 离散型

      \[ P(X = x_i,Y = y_j) = P(X = x_i)\cdot P(Y = y_j) \]
    • 连续型

      \[ f(x,y) = f_X(x)\cdot f_Y(y) \]
  • 独立性定理:若联合概率密度分布函数 \(f(x,y)\) 可以写成 两个函数的乘积,即 \(f(x,y) = r(x)\cdot g(y)\) ,则 \(X,Y\) 相互独立,且有

    \[ \begin{aligned}f_X(x) &= \dfrac{r(x)}{\displaystyle\int_{-\infty}^{+\infty}r(x)\ \mathrm dx}\\ f_Y(y) &= \dfrac{g(y)}{\displaystyle\int_{-\infty}^{+\infty}g(y)\ \mathrm dy} \end{aligned} \]
  • 性质

    1. 如果二维随机变量 \(X,Y\) 相互独立,则有
    \[ \begin{aligned} f_X(x) &= f_{X\ |\ Y}(x\mid y),\quad f_Y(y)>0\\ f_Y(y) &= f_{Y\ |\ X}(y\mid x),\quad f_X(x)>0 \end{aligned} \]
    1. 独立的二维随机变量的连续函数仍独立:设 \(X,Y\) 为相互独立的二维随机变量,\(u(x),v(y)\) 为连续函数,则 \(U = u(X),V = v(Y)\) 也相互独立

多维随机变量函数的分布

多维离散型随机变量函数的分布

\((X,Y)\) 的联合分布律为 \(P(X = x_i,Y=y_j) = p_{ij},(i,j = 1,2,\cdots)\)\(z = g(x,y)\) 为一个二元函数,\(Z = g(X,Y)\) 为随机变量 \((X,Y)\) 的函数。

假设 \(Z\) 的全部不同取值记为 \(z_k\),并且所有使得 \(g(x,y) = z_k\) 的点记为 \((x_{i_k},y_{j_k})\),即 \(z_k = g(x_{i_k},y_{j_k})\),则 \(Z\) 的分布律:

\[ P(Z = z_k) = P(g(X,Y) = z_k) = \sum_{g(x_{i_k},y_{j_k}) = z_k}P(X = x_{i_k},Y =y_{j_k}),\ k = 1,2,\cdots \]
  • 特别地,当 \(Z = X+Y\) 时,

    \[ P(Z=r)=P(X+Y=r)=\sum_{i=0}^{r} P(X=i,Y=r-i) \]
  • 进一步,当 \(X\)\(Y\) 相互独立时,若 \(P(X=k)=a_{k},P(Y=k)=b_{k},k=0,1,2,\cdots\),则 \(Z = X+Y\) 的分布律满足 离散卷积公式

    \[ P(Z=r)=\sum_{i=0}^{r} P(X=i) P(Y=r-i)=\sum_{i=0}^{r} a_{i} b_{r-i} \]
  • 性质

    1. Poisson 分布的可加性:若随机变量 \(X,Y\) 相互独立,且都服从 Poisson 分布,即 \(X\sim P(\lambda_1),Y\sim P(\lambda_2)\),则 其和也服从 Poisson 分布,即

      \[ X+Y\sim P(\lambda_1+\lambda_2) \]
    2. 项分布的可加性:若随机变量 \(X,Y\) 相互独立,且都服从二项分布,即 \(X\sim B(n,p),Y\sim B(m,p)\),则 其和也服从二项分布,即

      \[ X+Y\sim B(n+m,p) \]

多维连续型随机变量函数的分布

\((X,Y)\) 的联合概率密度为 \(f(x,y)\)\(g(x,y)\) 是一个二元函数,令 \(Z = g(X,Y)\),则 \(Z\) 的分布函数:

\[ F_{Z}(z)=P(Z \le z)=P(g(X,Y) \le z)=\iint\limits_{g(x,y) \le z} f(x,y) \ \mathrm{d} x \ \mathrm{d} y \]

若有非负可积函数 \(f_Z(z)\),使得

\[ F_{Z}(z)=\int_{-\infty}^{z} f_{Z}(u) \ \mathrm{d} u \]

则随机变量函数 \(Z = g(X,Y)\) 的概率密度为

\[ f_Z(z) = F'_Z(z) \]

和的分布

和的分布:\(Z = X + Y\)

\[ f_Z(z) = \int_{-\infty}^{+\infty}f(x,z-x)\ \mathrm dx = \int_{-\infty}^{+\infty}f(z-y,y)\ \mathrm dy \]

\(X,Y\) 相互独立,则

\[ \begin{aligned} f_Z(z) &= \int_{-\infty}^{+\infty}f_X(x)\cdot f_Y(z-x)\ \mathrm dx\\ &= \int_{-\infty}^{+\infty}f_X(z-y)\cdot f_Y(y)\ \mathrm dy \xlongequal{\triangle}f_X * f_Y(z) \end{aligned} \]

函数 \(f_Z(z)\) 称为称为函数 \(f_X(x)\)\(f_Y(y)\)卷积

线性函数的分布 \(Z=a X+b Y+c\)

更一般地,设 \(Z=a X+b Y+c\)\(a,b,c\) 为常数,\(a,b\neq0\)

\[ f_{Z}(z)=\frac{1}{|b|} \int_{-\infty}^{+\infty} f\left(t,\frac{z-a t-c}{b}\right) \mathrm{d} t=\frac{1}{|a|} \int_{-\infty}^{+\infty} f\left(\frac{z-b t-c}{a},t\right) \mathrm{d} t \]

商的分布

商的分布:\(Z = \dfrac XY\)

\[ \begin{aligned}F_Z(z) &= P\left(\dfrac XY\le z\right)\\ &= \iint\limits_{\frac xy\le z}f(x,y)\ \mathrm dx\ \mathrm dy \\&= \int_0^{+\infty}\mathrm dy\int_{-\infty}^{yz} f(x,y)\ \mathrm dx + \int^0_{-\infty}\mathrm dy\int_{yz}^{+\infty} f(x,y)\ \mathrm dx \end{aligned} \]

概率密度为

\[ f_Z(z) = \int_{-\infty}^{+\infty}f(yz,y)\ |\ y\ |\ \mathrm dy \]

\(X,Y\) 相互独立,则

\[ f_Z(z) = \int_{-\infty}^{+\infty}f_X(yz)\cdot f_Y(y)\ |\ y\ |\ \mathrm dy \]

平方和的分布

平方和的分布:\(Z = X^2+Y^2\)

\[ f_{Z}(z)=\begin{cases} 0,& z<0 \\ \dfrac{1}{2} \displaystyle\int_{0}^{2 \pi} f(\sqrt{z} \cos \theta,\sqrt{z} \sin \theta) \mathrm{d} \theta,& z \geqslant 0 \end{cases} \]

极值的分布

极值的分布:\(M = \max\{X,Y\},N = \min\{X,Y\}\)

  • 离散型随机变量:

    \[ \begin{aligned} P(M = m) &= P(\max\{X,Y\} = m)\\ &= P(X = m,Y \le m) + P(Y = m,X \le m) - P(X = m,Y = m)\\ &= P(X = m)\cdot P(Y \le m) + P(Y = m)\cdot P(X \le m) - P(X = m)\cdot P(Y = m)\\ P(N = n) &= P(\min\{X,Y\} = n)\\ &= P(X = n,Y \ge n) + P(Y = n,X \ge n) - P(X = n,Y = n)\\ &= P(X = n)\cdot P(Y \ge n) + P(Y = n)\cdot P(X \ge n) - P(X = n)\cdot P(Y = n)\\ \end{aligned} \]
  • 连续型随机变量:设 \(X,Y\) 相互独立

    \[ \begin{aligned} F_M(u) &= P(\max\{X,Y\}\le u)\\ &=P(X\le u,Y\le u)\\ &=P(X\le u)\cdot P(Y\le u)\\ &= F_X(u)\cdot F_Y(u)\\ F_N(v) &= P(\min\{X,Y\}\le v)\\ &=1-P(X>v,Y>v)\\&=1-P(X> v)\cdot P(Y> v)\\ &= 1 - \big(1-F_X(v)\big)\cdot \big(1-F_Y(v)\big) \end{aligned} \]

变量代换法

设已知二维随机变量 \((X,Y)\) 的概率密度函数 \(f_{XY}(x,y)\),构造一个新的二维随机变量 \((Z,V)\),满足

\[ \begin{cases} Z=g(X,Y) \\ V=r(X,Y) \end{cases} \]

\(\begin{cases} z=g(x,y) \\ v=r(x,y) \end{cases}\) 存在唯一的反函数 \(\begin{cases} x=h(z,v) \\y=s(z,v)\end{cases}\),其中 \(h,s\) 有连续偏导数,记雅可比行列式

\[ J = \begin{vmatrix}h_z&h_v\\s_z&s_v\end{vmatrix} \]

\[ f_{ZV}(z,v) = f_{XY}\bigl(h(z,v),s(z,v)\bigr)\ |\ J\ | \]