条件期望函数及其性质

条件期望函数

YX 是两个随机变量,对于任意一个实数 xsupp(X) 都仅存在一个实数 E[YX=x] 与之对应,因此可以构造随机变量 X 的映射 XE[YX],称 E[YX] 为条件期望函数 (CEF)。

Law of Iterated Expectations

Theorem

EX[EY(YX)]=E[Y]

Proof
离散型随机变量

EX[EY(YX)]=xEY(YX=x)P(X=x)=xyyP(Y=yX=x)P(X=x)=xyyP(X=xY=y)P(Y=y)=xP(X=xY=y)yyP(Y=y)=yyP(Y=y)=E[Y]

连续型随机变量

EX[EY(YX)]=xEY(YX)fX(x)dx=xyyfYX(yx)dyfX(x)dx=xyyfXY(xy)fY(y) dydx=xfXY(xy)dxyyfY(y)dy=yyfY(y)dy=E[Y]

推论:将 E(Y|X) 整体视为一个随机变量

E(Y|X)=EZ[EY(Y|X,Z)X]

Best Predictor

Theorem Let g(X) be any function of X, then

E[Y|X]=argmingE[(Yg(X))2]

Proof

E[(Yg(X))2]=E[(YE[Y|X]+E[Y|X]g(X))2]=E[(YE[Y|X])2]+E[(E[Y|X]g(X))2]++2E[(YE[Y|X])(E[Y|X]g(X))]

the first term

E[(YE[Y|X])2]=E{(YE[Y|X])2|X}=E{Var[Y|X]}0

the last term

2E[(YE[Y|X])(E[Y|X]g(X))]=2E[E{(YE[Y|X])(E[Y|X]g(X))|X}]=2E[(E[Y|X]g(X))E{YE[Y|X]|X}]=2E[(E[Y|X]g(X)){E[Y|X]E[Y|X]}]=0

therefore, take

g(X)=E[Y|X]

因此,条件期望函数 E[YX] 是给定 XY 做出的最小平方预测