Linear Projection Model

Abstract

由于 CEF 的函数形式本质上是未知的,Linear CEF Model 实际上使用了很强的假设(上帝视角),且没有给出参数估计量。为了假设更为稳健,改为无论真实的 CEF 是什么,都进行线性拟合(符合实践)并给出参数估计量,为了使得参数估计量存在添加了一些技术性假设。

Setup

Linear CEF Model 设定如下:

  1. 定义 Linear Projection Error;
  2. 不对 CEF 形式作出假设;
  3. 保证模型参数可识别。
(1)epYXTβp

其中,βp 定义为

βpargminbRkE[(YXTb)2]

为了保证 βp 有解,假设 YX 具有有限的期望、方差和协方差:

(2){E(Y2)<E(X2)<E(XXT) is positive definite.

求解参数

根据 βp 的定义,设 S(b)E[(YXTb)2] ,展开为

S(b)=E[(YTbTX)(YXTb)]=E[Y2]2bTE[XY]+bTE[XXT]b

F.O.C(根据矩阵求导

S(b)b=2E[XY]+2E[XXT]b=0βpE(XXT)1E(XY)
Note

值得注意的是,根据 期望迭代法则

βp=E(XXT)1E(XE[YX])

因此 YX 的投影参数和 E[YX]X 的投影参数是一致的。

LP Error

(1)E[Xep]=0(2)E[ep]=0(3)Cov[Xj,ep]=0j=1,,k

Proof

(1)E[Xep]=E[X(YXTβ)]=E[XY]E[XXT]β=E[XY]E[XXT]E[XXT]1E[XY]=0
Important

(2)(3) 的证明都要求 X 包含常数项。

(1) 表明 E[(X1ep,,Xkep)T]=0,若 X 包含常数项,则对应的分量有

(2)E[ep]=0

根据 (1)(2) 可知

(3)Cov[Xj,ep]=E[Xjep]E[Xj]E[ep]=0

Best Linear Predictor

Theorem

βp=argminbRkE{(E[YX]XTb)2}

Proof
According to the definition of β

E[(YXTb)2]=E[(YE[YX]+E[YX]XTb)2]=E[(YE[YX])2]+E[(E[YX]XTb)2]++2E[(YE[YX])(E[YX]XTb)]

first term

E[(YE[YX])2]=E[e2]0

last term (with E(h(X)e)=0)

2E{(YE[YX])(E[YX]XTb)}=2E{e(E[YX]XTb)}=0

因此,βp 的定义等价于对第二项求解最小值,命题得证。

Summary

  1. 条件期望函数是 Y最优估计(根据 CEF的性质
  2. 线性投影是 Y最优线性估计(根据 βp 的定义)
  3. 线性投影是条件期望函数的最优线性估计(根据上述 Theorem)

虽然简单的线性投影对 Y 的预测效果十分糟糕,但计量经济学更关心 E[YX] 的变化规律。在 X 为离散变量且模型饱和时(包含所有交互项),线性投影甚至能完全拟合条件期望函数 E[YX],因此线性投影仍是一个实用的技术。