第三章 多维随机变量及其分布¶
二维随机变量¶
二维随机变量及其联合分布函数¶
-
定义:设 \(E\) 是⼀个随机试验,\(\mathit \Omega\) 是其样本空间,若对 \(\mathit \Omega\) 中的任意⼀个样本点 \(\omega\) 按照⼀定的对应法则,存在⼀对实数 \(X(\omega),Y(\omega)\) 与之对应,简记为 \((X,Y)\),称之为 二维随机变量
-
联合分布函数:
\[ F(x,y) = P(\{X\le x\}\cup \{Y\le y\}) = P(X\le x,Y\le y) \] -
性质
-
\(0\le F(x,y)\le 1\),对于任意固定的 \(x,y\),有
\[ F(-\infty,y) = 0,F(x,-\infty) = 0,F(-\infty,-\infty) = 0,F(+\infty,+\infty) = 1 \] -
对 \(F(x,y)\) 固定其中⼀个变量,它关于另⼀个变量是单调不减的函数
-
对 \(F(x,y)\) 固定其中⼀个变量,它关于另⼀个变量是右连续函数
\[ F(x+0,y) = F(x,y),\quad F(x,y+0) = F(x,y) \] -
对任意实数 \(a<b,c<d\),(图形为一个矩形)
\[ F(b,d) - F(a,d)-F(b,d) + F(a,c) = P(a<X\le b,c<Y \le d)\ge0 \] -
对于平面右上角的一块无穷区域 \(\bf I\),计算概率时应当将整个平面减去三个区域 \(\bf II,III,IV\)
\[ \begin{aligned} P(X> a,Y>c) &= P(a<X<+\infty,c<y<+\infty)\\ &=1-F(+\infty,c) - F(a,+\infty)+F(a,c)\\ &\neq 1- F(a,c) \end{aligned} \]
-
-
边缘分布函数:设⼆维随机变量 \((X,Y)\) 的分布函数为 \(F(x,y)\),分量 \(X\) 和 \(Y\) 也都是随机变量,各⾃的分布函数分别记为 \(F_X(x),F_Y(y)\),并依次称为随机变量 \((X,Y)\) 关于 \(X,Y\) 的 边缘分布函数
\[ \begin{aligned} F_X(x) &= P(X\le x) = F(x,+\infty)\\ F_Y(y) &= P(Y\le y) = F(+\infty,y) \end{aligned} \]
二维离散型随机变量¶
- 定义:随机变量 \((X,Y)\) 在⼆维平⾯上所有可能的取值为有限对或可列无穷对,则称 \((X,Y)\) 为 ⼆维离散型随机变量
- 设⼆维随机变量 \((X,Y)\) 的所有可能取值为 \((x_i,y_i),i,j = 1,2,\cdots\),则称 \(P(X=x_i,Y=y_i)=p_{ij},i = j = 1,2,\cdots\) 为⼆维离散型随机变量 \((X,Y)\) 的 联合分布律 或联合分布列,简称为 分布律
-
性质:若某数列满足下列性质,则可以作为某个二维离散型随机变量的分布律
- 非负性
\[ p_{ij}\ge 0\ (i,j = 1,2,\cdots) \]- 规范性
\[ \sum_i\sum_jp_{ij} = 1 \]
由分布律求分布函数¶
⼆维离散型随机变量的分布函数与分布律互为确定
二维离散型随机变量的边缘分布律¶
以下分别为 \((X,Y)\) 关于 \(X\) 和 \(Y\) 的 边缘分布律
二维连续型随机变量¶
-
分布函数:⼆维连续型随机变量 \((X,Y)\) 的分布函数 \(F(X,Y)\) 为 \((X,Y)\) 的联合概率密度函数 \(f(x,y)\) (⼆元⾮负可积函数) 的二重积分
\[ F(x,y) = \int_{-\infty}^x\int_{-\infty}^yf(u,v)\ \mathrm du\ \mathrm dv \] -
性质:
-
非负性
\[ f(x,y)\ge 0,\quad(x,y)\in\mathbb R^2 \] -
规范性
\[ \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\ \mathrm dy = 1 \] -
样本点落在任一区域 \(D\) 的概率
\[ P((X,Y)\in D) = \iint\limits_D f(x,y)\ \mathrm dx\ \mathrm dy \] -
根据分布函数求概率密度函数 \(f(x,y)\) 连续点处
\[ \dfrac{\partial^2F}{\partial x\ \partial y} = f(x,y) \]
-
-
边缘概率密度:已知联合分布可以求得边缘分布,反之不能确定
\[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx\\ \end{aligned} \]
常用连续型二维随机变量分布¶
均匀分布¶
连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 均匀分布,记为 \((X,Y)\sim U(G)\), 则其概率密度函数为
- \(A_G\) 为 \(G\) 的面积
二维正态分布¶
连续型随机变量 \((X,Y)\) 服从二维有界区域 \(G\) 上的 二维正态分布, 记为 \((X,Y)\sim N(\mu_1,\sigma_1^2; \mu_2,\sigma_2^2; \rho)\), 则其概率密度函数为
- 二维正态分布的边缘分布为两个独立的一维正态分布
二维随机变量的条件分布¶
二维离散型随机变量的条件分布¶
-
定义:设有⼆维离散型随机变量 \((X,Y)\)
-
对于固定的 \(j\),若 \(P(Y = y_j)>0\),则 在 \(\{Y = y_j\}\) 的条件下 \(X\) 的条件分布律 为
\[ P(X = x_i\mid Y = y_j) = \dfrac{P(X = x_i,Y = y_j)}{P(Y = y_j)} = \dfrac{p_{ij}}{p_{\bullet j}},\ i = 1,2,\cdots \]- \(P(Y = y_j)\) 即边缘分布律:分布律表格中将 \(Y = y_j\) 一列的概率全部相加
- 对于固定的 \(i\),若 \(P(X = x_i)>0\),则 在 \(\{X = x_i\}\) 的条件下 \(Y\) 的条件分布律 为
\[ P(Y = y_j\mid X = x_i) = \dfrac{P(X = x_i,Y = y_j)}{P(X = x_i)} = \dfrac{p_{ij}}{p_{i\bullet}},\ j = 1,2,\cdots \]- \(P(X = x_i)\) 即边缘分布律:分布律表格中将 \(X = x_i\) 一行的概率全部相加
- 性质
-
\[ P(X = x_i\mid Y = y_j)\ge 0 \]
-
- \(P(Y = y_j)\) 即边缘分布律:分布律表格中将 \(Y = y_j\) 一列的概率全部相加
-
\[ \displaystyle\sum_iP(X = x_i\mid Y = y_j) = \sum_i\dfrac{p_{ij}}{p_{\bullet j}} =\dfrac{1}{p_{\bullet j}}\sum_ip_{ij} = 1 \]
-
乘法公式
\[ P(X = x_i,Y = y_j) = P(Y = y_j)\ P(X = x_i\mid Y = y_j) ,\ i,j = 1,2,\cdots \] -
全概率公式
\[ P(X = x_i) = \sum_j P(Y = y_j)\ P(X = x_i\mid Y= y_j),i = 1,2,\cdots \]
-
⼆维连续型随机变量的条件分布¶
-
定义:设⼆维随机变量 \((X,Y)\) 的联合概率密度为 \(f(x,y)\),\(X,Y\) 的边缘概率密度分别为 \(f_X(x),f_Y(y)\)
-
当 \(f_Y(y) > 0\) 时
-
在 \(\{Y = y\}\) 的条件下 \(X\) 的条件概率密度 为
\[ f_{X\ |\ Y} (x\mid y) = \dfrac{f(x,y)}{f_Y(y)},\quad -\infty<x<+\infty \] -
在 \(\{Y = y\}\) 的条件下 \(X\) 的条件分布函数 为
\[ F_{X\ |\ Y} (x\mid y) = \int_{-\infty}^x\dfrac{f(u,y)}{f_Y(y)}\ \mathrm du,\quad -\infty<x<+\infty \]
-
-
当 \(f_X(x) > 0\) 时
-
在 \(\{X = x\}\) 的条件下 \(Y\) 的条件概率密度 为
\[ f_{Y\ |\ X} (y\mid x) = \dfrac{f(x,y)}{f_X(x)},\quad -\infty<y<+\infty \] -
在 \(\{X = x\}\) 的条件下 \(Y\) 的条件分布函数 为
\[ F_{Y\ |\ X} (y\mid x) = \int_{-\infty}^y\dfrac{f(x,v)}{f_X(x)}\ \mathrm dv,\quad -\infty<y<+\infty \]
-
-
-
性质:
-
类似乘法公式
\[ \begin{aligned} f(x,y) &= f_X(x)\ f_{Y\ |\ X} (y\mid x)\quad f_X(x)>0\\ &= f_Y(y)\ f_{X\ |\ Y} (x\mid y)\quad f_Y(y)>0 \end{aligned} \] -
类似全概率公式
\[ \begin{aligned} f_X(x) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dy = \int_{-\infty}^{+\infty}f_{X\ |\ Y}(x\mid y)\cdot f_Y(y)\ \mathrm dy\\ f_Y(y) &= \int_{-\infty}^{+\infty}f(x,y)\ \mathrm dx = \int_{-\infty}^{+\infty}f_{Y\ |\ X}(y\mid x)\cdot f_X(x)\ \mathrm dx \end{aligned} \] -
类似 Bayes 公式
\[ \begin{aligned} f_{X \mid Y}(x \mid y)&=\dfrac{f(x,y)}{f_{Y}(y)}=\dfrac{f_{Y \mid X}(y \mid x) \cdot f_{X}(x)}{f_{Y}(y)} \\ f_{Y \mid X}(y \mid x)&=\dfrac{f(x,y)}{f_{X}(x)}=\dfrac{f_{X \mid Y}(x \mid y) \cdot f_{Y}(y)}{f_{X}(x)} \end{aligned} \]
-
二维随机变量的独立性¶
-
定义:相互独立的二维随机变量 \((X,Y)\) 对任意 \(x,y\) 都有
\[ P(X \le x,Y \le y)=P(X \le x) P(Y \le y) \] -
判定独立性:
-
离散型:
\[ P(X = x_i,Y = y_j) = P(X = x_i)\cdot P(Y = y_j) \] -
连续型:
\[ f(x,y) = f_X(x)\cdot f_Y(y) \]
-
-
独立性定理:若联合概率密度分布函数 \(f(x,y)\) 可以写成 两个函数的乘积,即 \(f(x,y) = r(x)\cdot g(y)\) ,则 \(X,Y\) 相互独立,且有
\[ \begin{aligned}f_X(x) &= \dfrac{r(x)}{\displaystyle\int_{-\infty}^{+\infty}r(x)\ \mathrm dx}\\ f_Y(y) &= \dfrac{g(y)}{\displaystyle\int_{-\infty}^{+\infty}g(y)\ \mathrm dy} \end{aligned} \] -
性质:
- 如果二维随机变量 \(X,Y\) 相互独立,则有
\[ \begin{aligned} f_X(x) &= f_{X\ |\ Y}(x\mid y),\quad f_Y(y)>0\\ f_Y(y) &= f_{Y\ |\ X}(y\mid x),\quad f_X(x)>0 \end{aligned} \]- 独立的二维随机变量的连续函数仍独立:设 \(X,Y\) 为相互独立的二维随机变量,\(u(x),v(y)\) 为连续函数,则 \(U = u(X),V = v(Y)\) 也相互独立
多维随机变量函数的分布¶
多维离散型随机变量函数的分布¶
设 \((X,Y)\) 的联合分布律为 \(P(X = x_i,Y=y_j) = p_{ij},(i,j = 1,2,\cdots)\),\(z = g(x,y)\) 为一个二元函数,\(Z = g(X,Y)\) 为随机变量 \((X,Y)\) 的函数。
假设 \(Z\) 的全部不同取值记为 \(z_k\),并且所有使得 \(g(x,y) = z_k\) 的点记为 \((x_{i_k},y_{j_k})\),即 \(z_k = g(x_{i_k},y_{j_k})\),则 \(Z\) 的分布律:
-
特别地,当 \(Z = X+Y\) 时,
\[ P(Z=r)=P(X+Y=r)=\sum_{i=0}^{r} P(X=i,Y=r-i) \] -
进一步,当 \(X\) 与 \(Y\) 相互独立时,若 \(P(X=k)=a_{k},P(Y=k)=b_{k},k=0,1,2,\cdots\),则 \(Z = X+Y\) 的分布律满足 离散卷积公式:
\[ P(Z=r)=\sum_{i=0}^{r} P(X=i) P(Y=r-i)=\sum_{i=0}^{r} a_{i} b_{r-i} \] -
性质:
-
Poisson 分布的可加性:若随机变量 \(X,Y\) 相互独立,且都服从 Poisson 分布,即 \(X\sim P(\lambda_1),Y\sim P(\lambda_2)\),则 其和也服从 Poisson 分布,即
\[ X+Y\sim P(\lambda_1+\lambda_2) \] -
⼆项分布的可加性:若随机变量 \(X,Y\) 相互独立,且都服从二项分布,即 \(X\sim B(n,p),Y\sim B(m,p)\),则 其和也服从二项分布,即
\[ X+Y\sim B(n+m,p) \]
-
多维连续型随机变量函数的分布¶
设 \((X,Y)\) 的联合概率密度为 \(f(x,y)\),\(g(x,y)\) 是一个二元函数,令 \(Z = g(X,Y)\),则 \(Z\) 的分布函数:
若有非负可积函数 \(f_Z(z)\),使得
则随机变量函数 \(Z = g(X,Y)\) 的概率密度为
和的分布¶
和的分布:\(Z = X + Y\)
若 \(X,Y\) 相互独立,则
函数 \(f_Z(z)\) 称为称为函数 \(f_X(x)\) 与 \(f_Y(y)\) 的 卷积
线性函数的分布 \(Z=a X+b Y+c\)¶
更一般地,设 \(Z=a X+b Y+c\),\(a,b,c\) 为常数,\(a,b\neq0\),
商的分布¶
商的分布:\(Z = \dfrac XY\)
概率密度为
若 \(X,Y\) 相互独立,则
平方和的分布¶
平方和的分布:\(Z = X^2+Y^2\)
极值的分布¶
极值的分布:\(M = \max\{X,Y\},N = \min\{X,Y\}\)
-
离散型随机变量:
\[ \begin{aligned} P(M = m) &= P(\max\{X,Y\} = m)\\ &= P(X = m,Y \le m) + P(Y = m,X \le m) - P(X = m,Y = m)\\ &= P(X = m)\cdot P(Y \le m) + P(Y = m)\cdot P(X \le m) - P(X = m)\cdot P(Y = m)\\ P(N = n) &= P(\min\{X,Y\} = n)\\ &= P(X = n,Y \ge n) + P(Y = n,X \ge n) - P(X = n,Y = n)\\ &= P(X = n)\cdot P(Y \ge n) + P(Y = n)\cdot P(X \ge n) - P(X = n)\cdot P(Y = n)\\ \end{aligned} \] -
连续型随机变量:设 \(X,Y\) 相互独立
\[ \begin{aligned} F_M(u) &= P(\max\{X,Y\}\le u)\\ &=P(X\le u,Y\le u)\\ &=P(X\le u)\cdot P(Y\le u)\\ &= F_X(u)\cdot F_Y(u)\\ F_N(v) &= P(\min\{X,Y\}\le v)\\ &=1-P(X>v,Y>v)\\&=1-P(X> v)\cdot P(Y> v)\\ &= 1 - \big(1-F_X(v)\big)\cdot \big(1-F_Y(v)\big) \end{aligned} \]
变量代换法¶
设已知二维随机变量 \((X,Y)\) 的概率密度函数 \(f_{XY}(x,y)\),构造一个新的二维随机变量 \((Z,V)\),满足
设 \(\begin{cases} z=g(x,y) \\ v=r(x,y) \end{cases}\) 存在唯一的反函数 \(\begin{cases} x=h(z,v) \\y=s(z,v)\end{cases}\),其中 \(h,s\) 有连续偏导数,记雅可比行列式
则