概率论拾遗:自由度
摘 要 在线性回归模型的方差分析中, 自由度一般被形象地表述为自由取值的变量个数, 即变量总数减去限制条件的数量. 这种表述虽然易于理解但是并不本质. 本文讲述自由度的一个严格定义: 方差分析中的每一个平方和都可以写成二次型的形式, 而自由度是这些二次型矩阵的秩.
1 多元线性回归模型
1.1 多元线性回归模型及其矩阵表示
给定 p−1 个解释变量 x1,…,xp−1 和对应的响应变量 y. 假定有 n 条观测数据
OBS={(x1(i),…,xp−1(i),y(i))}i=1n
建立多元线性回归模型:
y(i)=b0+b1x1(i)+⋯+bp−1xp−1(i)+e(i)
其中 e(i) 是残差项. 我们希望 {e(i)}i=1n 是来自同一个正态随机变量 ε∼N(0,σ2) 的简单随机样本.
现在用矩阵语言重述上面的内容. 定义资料矩阵
X=1⋮1x1(1)⋮x1(n)⋯⋯xp−1(1)⋮xp−1(n)
即每行是一个观测对象, 每列是一个解释变量. 定义响应变量向量 y=(y(1),…,y(n))T、系数向量 b=(b0,b1,…,bp−1)T、误差项向量 e=(e(1),…,e(n))T, 则原模型可以写成矩阵形式
y=Xb+e
1.2 最小二乘法
最小二乘法的目的是找到一组 b 使得残差平方和最小. 定义残差平方和
SSE:=eTe=(y−Xb)T(y−Xb)=bTXTXb−2(XTy)Tb+yTy
这是一个关于 b 的二次函数.
一般的二次函数形式及其梯度为
f=21xTQx+qTx+q