第三章多维随机变量及其分布¶

Back to Course Home

二维随机变量¶

二维随机变量及其联合分布函数¶

定义：设 \(E\) 是⼀个随机试验，\(\mathit \Omega\) 是其样本空间，若对 \(\mathit \Omega\) 中的任意⼀个样本点 \(\omega\) 按照⼀定的对应法则，存在⼀对实数 \(X(\omega),Y(\omega)\) 与之对应，简记为 \((X,Y)\)，称之为 二维随机变量
联合分布函数：

\[ F(x,y) = P(\{X\le x\}\cup \{Y\le y\}) = P(X\le x,Y\le y) \]
性质
1. \(0\le F(x,y)\le 1\)，对于任意固定的 \(x,y\)，有
  
  \[ F(-\infty,y) = 0,F(x,-\infty) = 0,F(-\infty,-\infty) = 0,F(+\infty,+\infty) = 1 \]
2. 对 \(F(x,y)\) 固定其中⼀个变量，它关于另⼀个变量是单调不减的函数
3. 对 \(F(x,y)\) 固定其中⼀个变量，它关于另⼀个变量是右连续函数
  
  \[ F(x+0,y) = F(x,y),\quad F(x,y+0) = F(x,y) \]
4. 对任意实数 \(a<b,c<d\)，(图形为一个矩形)
  
  \[ F(b,d) - F(a,d) - F(b,c) + F(a,c) = P(a<X\le b,c<Y \le d)\ge0 \]
5. 对于平面右上角的一块无穷区域 \(\bf I\)，计算概率时应当将整个平面减去三个区域 \(\bf II,III,IV\)
  
  \[ \begin{aligned} P(X> a,Y>c) &= P(a<X<+\infty,c<y<+\infty)\\ &=1-F(+\infty,c) - F(a,+\infty)+F(a,c)\\ &\neq 1- F(a,c) \end{aligned} \]
边缘分布函数：设⼆维随机变量 \((X,Y)\) 的分布函数为 \(F(x,y)\)，分量 \(X\) 和 \(Y\) 也都是随机变量，各⾃的分布函数分别记为 \(F_X(x),F_Y(y)\)，并依次称为随机变量 \((X,Y)\) 关于 \(X,Y\) 的 边缘分布函数

\[ \begin{aligned} F_X(x) &= P(X\le x) = F(x,+\infty)\\ F_Y(y) &= P(Y\le y) = F(+\infty,y) \end{aligned} \]

二维离散型随机变量¶

定义：随机变量 \((X,Y)\) 在⼆维平⾯上所有可能的取值为有限对或可列无穷对，则称 \((X,Y)\) 为 ⼆维离散型随机变量
设⼆维随机变量 \((X,Y)\) 的所有可能取值为 \((x_i,y_i),i,j = 1,2,\cdots\)，则称 \(P(X=x_i,Y=y_i)=p_{ij},i = j = 1,2,\cdots\) 为⼆维离散型随机变量 \((X,Y)\) 的 联合分布律 或联合分布列，简称为 分布律

\[ \begin{array}{c|c|c} \hline P_{ji} & \begin{array}{ccccc} & & Y & & \\ \hline y_1 & y_2 & \cdots & y_j & \cdots \end{array} & p_{i\bullet} = \displaystyle\sum_j p_{ij} \\ \hline \begin{array}{c|c} & x_1 \\ & x_2 \\ X & \vdots \\ & x_i \\ & \vdots \end{array} & \begin{array}{ccccc} p_{11} & p_{12} & \cdots & p_{1j} & \cdots \\ p_{21} & p_{22} & \cdots & p_{2j} & \cdots \\ \vdots & \vdots & & \vdots & \\ p_{i1} & p_{i2} & \cdots & p_{ij} & \cdots \\ \vdots & \vdots & & \vdots & \end{array} & \begin{array}{c} p_{1\bullet} \\ p_{2\bullet} \\ \vdots \\ p_{i\bullet} \\ \vdots \end{array} \\ \hline p_{\bullet j} = \displaystyle\sum_i p_{ij} & \begin{array}{ccccc} p_{\bullet 1} & p_{\bullet 2} & \cdots & p_{\bullet j} & \cdots \end{array} & \displaystyle\sum_i\sum_j p_{ij} = 1 \\ \hline \end{array} \]

性质：若某数列满足下列性质，则可以作为某个二维离散型随机变量的分布律
- 非负性
\[ p_{ij}\ge 0\ (i,j = 1,2,\cdots) \]
- 规范性
\[ \sum_i\sum_jp_{ij} = 1 \]

由分布律求分布函数¶

⼆维离散型随机变量的分布函数与分布律互为确定

\[ F(x,y) = P(X\le x,Y\le y) = \sum_{x_i\le x,y_j\le y}P(X=x_i,Y=y_j) = \sum_{x_i\le x,y_j\le y}p_{ij} \]

二维离散型随机变量的边缘分布律¶

以下分别为 \((X,Y)\) 关于 \(X\) 和 \(Y\) 的 边缘分布律

\[ \begin{aligned} P(X= x_i) &= \sum_j p_{ij} \xlongequal{记为} p_{i\bullet},\ i=1,2,\cdots\\ P(Y= y_j) &= \sum_i p_{ij} \xlongequal{记为} p_{\bullet j},\ j=1,2,\cdots \end{aligned} \]

二维连续型随机变量¶

分布函数：⼆维连续型随机变量 \((X,Y)\) 的分布函数 \(F(X,Y)\) 为 \((X,Y)\) 的联合概率密度函数 \(f(x,y)\) (⼆元⾮负可积函数) 的二重积分

\[ F(x,y) = \int_{-\infty}^x\int_{-\infty}^yf(u,v)\ \mathrm du\ \mathrm dv \]
性质：
1. 非负性
  
  \[ f(x,y)\ge 0,\quad(x,y)\in\mathbb R^2 \]
2. 规范性
  
  \[ \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\ \mathrm dy = 1 \]
3. 样本点落在任一区域 \(D\) 的概率
  
  \[ P((X,Y)\in D) = \iint\limits_D f(x,y)\ \mathrm dx\ \mathrm dy \]
4. 根据分布函数求概率密度函数 \(f(x,y)\) 连续点处
  
  \[ \dfrac{\partial^2F}{\partial x\ \partial y} = f(x,y) \]
边缘概率密度：已知联合分布可以求得边缘分布，反之不能确定

\[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\\ \end{aligned} \]

常用连续型二维随机变量分布¶

均匀分布¶

连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 均匀分布，记为 \((X,Y)\sim U(G)\)，则其概率密度函数为

\[ f(x,y) = \begin{cases}\dfrac{1}{A_G},&(x,y)\in G,\\0,&\text{otherwise}.\end{cases} \]

\(A_G\) 为 \(G\) 的面积

二维正态分布¶

连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 二维正态分布，记为 \((X,Y)\sim N(\mu_1,\sigma_1^2; \mu_2,\sigma_2^2; \rho)\)，则其概率密度函数为

\[ f(x,y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \left\{-\frac{1}{2\left(1-\rho^{2}\right)}\left[\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-2 \rho \frac{\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right]\right\} \]

二维正态分布的边缘分布为两个独立的一维正态分布

二维随机变量的条件分布¶

二维离散型随机变量的条件分布¶

定义：设有⼆维离散型随机变量 \((X,Y)\)
- 对于固定的 \(j\)，若 \(P(Y = y_j)>0\)，则 在 \(\{Y = y_j\}\) 的条件下 \(X\) 的条件分布律 为
  
  \[ P(X = x_i\mid Y = y_j) = \dfrac{P(X = x_i,Y = y_j)}{P(Y = y_j)} = \dfrac{p_{ij}}{p_{\bullet j}},\ i = 1,2,\cdots \]
  - \(P(Y = y_j)\) 即边缘分布律：分布律表格中将 \(Y = y_j\) 一列的概率全部相加
- 对于固定的 \(i\)，若 \(P(X = x_i)>0\)，则 在 \(\{X = x_i\}\) 的条件下 \(Y\) 的条件分布律 为
  
  \[ P(Y = y_j\mid X = x_i) = \dfrac{P(X = x_i,Y = y_j)}{P(X = x_i)} = \dfrac{p_{ij}}{p_{i\bullet}},\ j = 1,2,\cdots \]
  - \(P(X = x_i)\) 即边缘分布律：分布律表格中将 \(X = x_i\) 一行的概率全部相加
性质
1. \[ P(X = x_i\mid Y = y_j)\ge 0 \]
2. \[ \displaystyle\sum_iP(X = x_i\mid Y = y_j) = \sum_i\dfrac{p_{ij}}{p_{\bullet j}} =\dfrac{1}{p_{\bullet j}}\sum_ip_{ij} = 1 \]
3. 乘法公式
  
  \[ P(X = x_i,Y = y_j) = P(Y = y_j)\ P(X = x_i\mid Y = y_j) ,\ i,j = 1,2,\cdots \]
4. 全概率公式
  
  \[ P(X = x_i) = \sum_j P(Y = y_j)\ P(X = x_i\mid Y= y_j),i = 1,2,\cdots \]

⼆维连续型随机变量的条件分布¶

定义：设⼆维随机变量 \((X,Y)\) 的联合概率密度为 \(f(x,y)\)，\(X,Y\) 的边缘概率密度分别为 \(f_X(x),f_Y(y)\)
- 当 \(f_Y(y) > 0\) 时
  - 在 \(\{Y = y\}\) 的条件下 \(X\) 的条件概率密度 为
    
    \[ f_{X\mid Y} (x\mid y) = \dfrac{f(x,y)}{f_Y(y)},\quad -\infty<x<+\infty \]
  - 在 \(\{Y = y\}\) 的条件下 \(X\) 的条件分布函数 为
    
    \[ F_{X\mid Y} (x\mid y) = \int_{-\infty}^x\dfrac{f(u,y)}{f_Y(y)}\ \mathrm du,\quad -\infty<x<+\infty \]
- 当 \(f_X(x) > 0\) 时
  - 在 \(\{X = x\}\) 的条件下 \(Y\) 的条件概率密度 为
    
    \[ f_{Y\mid X} (y\mid x) = \dfrac{f(x,y)}{f_X(x)},\quad -\infty<y<+\infty \]
  - 在 \(\{X = x\}\) 的条件下 \(Y\) 的条件分布函数 为
    
    \[ F_{Y\mid X} (y\mid x) = \int_{-\infty}^y\dfrac{f(x,v)}{f_X(x)}\ \mathrm dv,\quad -\infty<y<+\infty \]
性质：
1. 类似乘法公式
  
  \[ \begin{aligned} f(x,y) &= f_X(x)\ f_{Y\mid X} (y\mid x)\quad f_X(x)>0\\ &= f_Y(y)\ f_{X\mid Y} (x\mid y)\quad f_Y(y)>0 \end{aligned} \]
2. 类似全概率公式
  
  \[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy = \int_{-\infty}^{+\infty}f_{X\mid Y}(x\mid y)\cdot f_Y(y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx = \int_{-\infty}^{+\infty}f_{Y\mid X}(y\mid x)\cdot f_X(x)\ \mathrm dx \end{aligned} \]
3. 类似 Bayes 公式
  
  \[ \begin{aligned} f_{X \mid Y}(x \mid y)&=\dfrac{f(x,y)}{f_{Y}(y)}=\dfrac{f_{Y \mid X}(y \mid x) \cdot f_{X}(x)}{f_{Y}(y)} \\ f_{Y \mid X}(y \mid x)&=\dfrac{f(x,y)}{f_{X}(x)}=\dfrac{f_{X \mid Y}(x \mid y) \cdot f_{Y}(y)}{f_{X}(x)} \end{aligned} \]

二维随机变量的独立性¶

定义：相互独立的二维随机变量 \((X,Y)\) 对任意 \(x,y\) 都有

\[ P(X \le x,Y \le y)=P(X \le x) P(Y \le y) \]
判定独立性：
- 离散型：
  
  \[ P(X = x_i,Y = y_j) = P(X = x_i)\cdot P(Y = y_j) \]
- 连续型：
  
  \[ f(x,y) = f_X(x)\cdot f_Y(y) \]
独立性定理：若联合概率密度分布函数 \(f(x,y)\) 可以写成 两个函数的乘积，即 \(f(x,y) = r(x)\cdot g(y)\) ，则 \(X,Y\) 相互独立，且有

\[ \begin{aligned}f_X(x) &= \dfrac{r(x)}{\displaystyle\int_{-\infty}^{+\infty}r(x)\ \mathrm dx}\\ f_Y(y) &= \dfrac{g(y)}{\displaystyle\int_{-\infty}^{+\infty}g(y)\ \mathrm dy} \end{aligned} \]
性质：
1. 如果二维随机变量 \(X,Y\) 相互独立，则有
\[ \begin{aligned} f_X(x) &= f_{X\mid Y}(x\mid y),\quad f_Y(y)>0\\ f_Y(y) &= f_{Y\mid X}(y\mid x),\quad f_X(x)>0 \end{aligned} \]
1. 独立的二维随机变量的连续函数仍独立：设 \(X,Y\) 为相互独立的二维随机变量，\(u(x),v(y)\) 为连续函数，则 \(U = u(X),V = v(Y)\) 也相互独立

多维随机变量函数的分布¶

多维离散型随机变量函数的分布¶

设 \((X,Y)\) 的联合分布律为 \(P(X = x_i,Y=y_j) = p_{ij},(i,j = 1,2,\cdots)\)，\(z = g(x,y)\) 为一个二元函数，\(Z = g(X,Y)\) 为随机变量 \((X,Y)\) 的函数。

假设 \(Z\) 的全部不同取值记为 \(z_k\)，并且所有使得 \(g(x,y) = z_k\) 的点记为 \((x_{i_k},y_{j_k})\)，即 \(z_k = g(x_{i_k},y_{j_k})\)，则 \(Z\) 的分布律：

\[ P(Z = z_k) = P(g(X,Y) = z_k) = \sum_{g(x_{i_k},y_{j_k}) = z_k}P(X = x_{i_k},Y =y_{j_k}),\ k = 1,2,\cdots \]

特别地，当 \(Z = X+Y\) 时，

\[ P(Z=r)=P(X+Y=r)=\sum_{i=0}^{r} P(X=i,Y=r-i) \]
进一步，当 \(X\) 与 \(Y\) 相互独立时，若 \(P(X=k)=a_{k},P(Y=k)=b_{k},k=0,1,2,\cdots\)，则 \(Z = X+Y\) 的分布律满足 离散卷积公式：

\[ P(Z=r)=\sum_{i=0}^{r} P(X=i) P(Y=r-i)=\sum_{i=0}^{r} a_{i} b_{r-i} \]
性质：
1. Poisson 分布的可加性：若随机变量 \(X,Y\) 相互独立，且都服从 Poisson 分布，即 \(X\sim P(\lambda_1),Y\sim P(\lambda_2)\)，则 其和也服从 Poisson 分布，即
  
  \[ X+Y\sim P(\lambda_1+\lambda_2) \]
2. ⼆项分布的可加性：若随机变量 \(X,Y\) 相互独立，且都服从二项分布，即 \(X\sim B(n,p),Y\sim B(m,p)\)，则 其和也服从二项分布，即
  
  \[ X+Y\sim B(n+m,p) \]

多维连续型随机变量函数的分布¶

设 \((X,Y)\) 的联合概率密度为 \(f(x,y)\)，\(g(x,y)\) 是一个二元函数，令 \(Z = g(X,Y)\)，则 \(Z\) 的分布函数：

\[ F_{Z}(z)=P(Z \le z)=P(g(X,Y) \le z)=\iint\limits_{g(x,y) \le z} f(x,y) \ \mathrm{d} x \ \mathrm{d} y \]

若有非负可积函数 \(f_Z(z)\)，使得

\[ F_{Z}(z)=\int_{-\infty}^{z} f_{Z}(u) \ \mathrm{d} u \]

则随机变量函数 \(Z = g(X,Y)\) 的概率密度为

\[ f_Z(z) = F'_Z(z) \]

和的分布¶

和的分布：\(Z = X + Y\)

\[ f_Z(z) = \int_{-\infty}^{+\infty}f(x,z-x)\ \mathrm dx = \int_{-\infty}^{+\infty}f(z-y,y)\ \mathrm dy \]

若 \(X,Y\) 相互独立，则

\[ \begin{aligned} f_Z(z) &= \int_{-\infty}^{+\infty}f_X(x)\cdot f_Y(z-x)\ \mathrm dx\\ &= \int_{-\infty}^{+\infty}f_X(z-y)\cdot f_Y(y)\ \mathrm dy \xlongequal{\triangle}f_X * f_Y(z) \end{aligned} \]

函数 \(f_Z(z)\) 称为称为函数 \(f_X(x)\) 与 \(f_Y(y)\) 的卷积

线性函数的分布 \(Z=a X+b Y+c\)¶

更一般地，设 \(Z=a X+b Y+c\)，\(a,b,c\) 为常数，\(a,b\neq0\)，

\[ f_{Z}(z)=\frac{1}{|b|} \int_{-\infty}^{+\infty} f\left(t,\frac{z-a t-c}{b}\right) \mathrm{d} t=\frac{1}{|a|} \int_{-\infty}^{+\infty} f\left(\frac{z-b t-c}{a},t\right) \mathrm{d} t \]

商的分布¶

商的分布：\(Z = \dfrac XY\)

\[ \begin{aligned}F_Z(z) &= P\left(\dfrac XY\le z\right)\\ &= \iint\limits_{\frac xy\le z}f(x,y)\ \mathrm dx\ \mathrm dy \\&= \iint\limits_{x\le yz, y> 0}f(x,y)\ \mathrm dx\ \mathrm dy + \iint\limits_{x\ge yz, y< 0}f(x,y)\ \mathrm dx\ \mathrm dy \\&= \int_{0}^{+\infty}\int_{-\infty}^{yz}f(x,y)\ \mathrm dx\ \mathrm dy + \int_{-\infty}^{0}\int_{yz}^{+\infty}f(x,y)\ \mathrm dx\ \mathrm dy \end{aligned} \]

概率密度为

\[ f_Z(z) = \int_{-\infty}^{+\infty}f(yz,y)\mid y\mid\mathrm dy \]

若 \(X,Y\) 相互独立，则

\[ f_Z(z) = \int_{-\infty}^{+\infty}f_X(yz)\cdot f_Y(y)\mid y\mid\mathrm dy \]

平方和的分布¶

平方和的分布：\(Z = X^2+Y^2\)

\[ f_{Z}(z)=\begin{cases} 0,& z<0 \\ \dfrac{1}{2} \displaystyle\int_{0}^{2 \pi} f(\sqrt{z} \cos \theta,\sqrt{z} \sin \theta) \mathrm{d} \theta,& z \geqslant 0 \end{cases} \]

极值的分布¶

极值的分布：\(M = \max\{X,Y\},N = \min\{X,Y\}\)

离散型随机变量：设 \(X,Y\) 相互独立

\[ \begin{aligned} P(M = m) &= P(\max\{X,Y\} = m)\\ &= P(X = m,Y \le m) + P(Y = m,X \le m) - P(X = m,Y = m)\\ &= P(X = m)\cdot P(Y \le m) + P(Y = m)\cdot P(X \le m) - P(X = m)\cdot P(Y = m)\\ P(N = n) &= P(\min\{X,Y\} = n)\\ &= P(X = n,Y \ge n) + P(Y = n,X \ge n) - P(X = n,Y = n)\\ &= P(X = n)\cdot P(Y \ge n) + P(Y = n)\cdot P(X \ge n) - P(X = n)\cdot P(Y = n)\\ \end{aligned} \]
连续型随机变量：设 \(X,Y\) 相互独立

\[ \begin{aligned} F_M(u) &= P(\max\{X,Y\}\le u)\\ &=P(X\le u,Y\le u)\\ &=P(X\le u)\cdot P(Y\le u)\\ &= F_X(u)\cdot F_Y(u)\\ F_N(v) &= P(\min\{X,Y\}\le v)\\ &=1-P(X>v,Y>v)\\&=1-P(X> v)\cdot P(Y> v)\\ &= 1 - \big(1-F_X(v)\big)\cdot \big(1-F_Y(v)\big) \end{aligned} \]

变量代换法¶

设已知二维随机变量 \((X,Y)\) 的概率密度函数 \(f_{XY}(x,y)\)，构造一个新的二维随机变量 \((Z,V)\)，满足

\[ \begin{cases} Z=g(X,Y) \\ V=r(X,Y) \end{cases} \]

设 \(\begin{cases} z=g(x,y) \\ v=r(x,y) \end{cases}\) 存在唯一的反函数 \(\begin{cases} x=h(z,v) \\y=s(z,v)\end{cases}\)，其中 \(h,s\) 有连续偏导数，记雅可比行列式

\[ J = \begin{vmatrix}h_z&h_v\\s_z&s_v\end{vmatrix} \]

则

\[ f_{ZV}(z,v) = f_{XY}\bigl(h(z,v),s(z,v)\bigr)\left| J \right| \]

第三章 多维随机变量及其分布¶