Goodness-of-Fit

Coefficient of determination

根据 Projection MatrixAnnihilator Matrix 的性质

Y^TY^=(PY)T(PY)=YTPY=YT(IM)Y=YTY(MY)T(MY)=YTYeTe

由此得到平方和分解法则

YTY=Y^TY^+eTe

回归方程中心化后应用平方和分解法则可得

(M0Y)T(M0Y)=(M0Y^)T(M0Y^)+eTeYTM0Y=Y^M0Y^+eTe(YY¯)T(YY¯)SST=(Y^Y¯)T(Y^Y¯)SSE+eTeSSR

定义 uncenterd R-squared 为

Ru2=Y^TY^YTY=1eTeYTY

定义 centered R-squared 为

R2=SSESST=1SSRSST

uncenterd R-quared 可以看作将模型未解释的信息和总信息(即没有模型)比较,而 centered R-squared 是将模型未解释的信息和最简模型(常数项回归)未解释的信息比较。后者更切实际也更常用。

定义 adjust R-squared 为

R¯2=1SSR/nkSST/n1=1(1R2)n1nk

其中,SST 的自由度相当于 Y 的维度减去 Y¯ 占用的一个维度;SSR 的自由度相当于残差的维度,而残差的维度即在投影过程中失去的维度,恰好等于消去矩阵的迹 Tr(M)=nk,;类似地,SSE 的自由度相当于投影到 span(X) 的维度,恰好等于投影矩阵的迹 Tr(P)=k

Theorem R2 相当于因变量真值 Y 和拟合值 Y^ 的样本相关系数的平方,即

R2=r(Y,Y^)2

Proof.
样本相关系数为

r(Y,Y^)=Cov(Y,Y^)Var(Y)Var(Y^)=(M0Y)T(M0Y^)(YTM0Y)(Y^TM0Y^)

其中 M0Y=M0(Y^+e)=M0Y^,因此

r(Y,Y^)2=(Y^TM0Y^)2(YTM0Y)(Y^TM0Y^)=Y^TM0Y^YTM0Y=SSESST=R2

附录:no matrix

总离差为

YiY¯=(YiY^i)+(Y^iY¯)

总离差平方和为

(YiY¯)2=[e^i+(Y^iY¯)]2=e^i2+(Y^iY¯)2+2e^i(Y^iY¯)

其中

e^i(Y^iY¯)=e^iY^i+Y¯e^i=e^i(XiTβ)=β[e^iXi1,,e^iXik]=0

定义

SST(YiY¯)2SSE(Y^iY^i¯)2=(Y^iY¯)2SSR(e^ie^i¯)2=e^i2

从而有

SST=SSE+SSR

定义

R2SSESST=1SSRSST=(Y^iY¯)2(YiY¯)2

可以证明,R2 等价于 YY^ 相关系数的平方