Frisch-Waugh-Lovell Theorem
分块回归
考虑回归模型
根据参数估计量的定义可得
因此有
由 可得
代入 可得
类似地可以得出 ,最终解得
由于消除矩阵是对称幂等的,所以 可以看作 对 回归得到的参数估计量;类似地, 可以看作 对 回归得到的参数估计量。其中
从几何的角度, 给出向量到 的距离向量; 给出向量到 的距离向量;从信息量的角度, 消去了 的信息。
特别地,如果 和 不相关,即 ,此时
说明 对 和 回归和 单独对 回归得到的系数一致;换言之,加入和解释变量不相关的变量不影响该变量的回归系数。
Frisch-Waugh-Lovell Theorem
要获得 ,可以依据以下步骤:
- 对 回归,获得残差
- 对 回归,获得残差
- 对 回归,获得残差
- 的回归系数恰为
本质上,这就是令 对 回归得到回归系数 ,其中 表示在 中去除分块 得到的矩阵对应的消除矩阵。
由于 是幂等矩阵,实际上 对 回归和 对 回归是等价的。因此第一步其实可以略去。
应用:中心化
若模型包含常数项,则 ,定义
考虑 的定义, 而 是一个所有元素全为 1 的 n×n 矩阵,后者右乘任意 n×1 的列向量都得到所有元素都为 n 维求和值列向量,再乘 就得到 n 维平均值列向量;类似地,右乘任意 n×k 的矩阵就得到 n×k 的平均值矩阵(均值在列方向上取)
对于任意(可以相乘的)矩阵 ,有
在上述模型中,设 为常数项 为斜率项,则斜率项系数为
或者更简单地写为
相应地,在单变量回归中,斜率项系数的估计值为: