跳转至

随机变量

相关概念

随机变量

给定概率空间 (Ω,F,P),定义在样本空间 Ω 上的函数 X:ΩR 若满足:对任意 tR 都有

{ωΩ:X(ω)t}F

则称 X随机变量

示性函数

对于样本空间 Ω 上的事件 A,定义随机变量

IA(ω)={1,ωA0,ωA

IA 是事件 A示性函数

分布函数

对于随机变量 X,称函数

F(x)=P(Xx)

为随机变量 X分布函数。记作 XF(x)

分布函数具有以下性质:

  • 右连续性F(x)=F(x+0)
  • 单调性:在 R 上单调递增(非严格)
  • F()=0,F(+)=1

同时我们可以证明,满足上述要求的函数都是某个随机变量的分布函数。因此,分布函数与随机变量之间一一对应。

随机变量的分类

随机变量按其值域(根据定义,随机变量是一个函数)是否可数分为 离散型连续型 两种。

离散型随机变量

X 为离散型随机变量,其所有可能的取值为 x1,x2,,则我们可以用一系列形如 P{X=xi}=pi 的等式来描述 X。这就是我们在高中课本中学过的 分布列

连续型随机变量

X 为连续型随机变量,考察 P{X=x} 往往是无意义的(因为这一概率很可能是 0)。

为什么说概率「很可能」是 0

考虑这样的随机变量 X:它以 12 的概率取 0,以 12 的概率服从开区间 (0,1) 上的均匀分布。显然 X 满足连续型随机变量的定义。

对任何实数 r(0,1),不难得到 P{X=r}=0,但同时有 P{X=0}=12

另一方面,设 XF(x),则

P(l<xl+Δx)=F(l+Δx)F(l)

一个自然的想法是用极限 limΔx0+F(l+Δx)F(l)Δx 来描述 X 取值为 l 的可能性。

这个式子就是我们熟知的导数,于是问题转化为寻找一个非负函数 f(x) 使得

F(x)=xf(x)dx

若这样的 f(x) 存在,则称之为 X密度函数

随机变量的独立性

前面讨论了随机事件的独立性。由于随机变量和随机事件紧密联系,我们还可以类似地给出随机变量独立性的定义。

定义

若随机变量 X,Y 满足对任意的 x,yR 都有

P(Xx,Yy)=P(Xx)P(Yy)

则称随机变量 X,Y 独立

Note

有些同学也许会注意到,中学课本中对随机变量独立性的定义是用形如 P(X=α) 的概率定义的,但由于连续性随机变量取特定值的概率通常是 0,故在更一般的情形下借助分布函数定义才是更加明智的选择。

性质

若随机变量 X,Y 相互独立,则对于任意函数 f,g,随机变量 f(X)g(Y) 相互独立。

Warning

有时候我们会研究相互独立的随机变量 X,Y 的某一函数 f(X,Y)(如 XY2)的分布。

尽管 XY 是独立的,但不能想当然地认为对 Y 的某一取值 yf(X,y)f(X,Y) 服从同样的分布。