异方差
在线性回归模型的经典假设下,运用最小二乘法回归估计得到的才是最优线性无偏估计量(BLUE)。在实际问题中,完全满足基本假设的情况并不多,不满足的基本假设的情况下称为基本假定违背,而异方差就是其中一种。
异方差检验的方法
对于异方差的检验有很多种,这里我们介绍3种方法:
①图示检验法:画出残差的平方与解释变量之间的散点图。
②布罗施-帕甘检验(B-P检验):首先用OLS求出残差平方和,其次用辅助回归式(即残差平方和与解释变量的OLS)得到新的F统计量和拟合优度。
③怀特检验(White检验):White可以作为我们的首选检验,因为White不受约束,可检查一切异方差
异方差检验(stata)
①图示检验法
Stata中有专门用于绘制残差与解释变量X之间的散点图的命令:
rvpplot X
或者可以用具体的操作实现:
- predict e,residuals #提取残差序列命名为e
- gen r2 = e^2 #将残差序列的平方命名为r2
- scatter r2 X #画出残差的平方与解释变量X之间的散点图
②布罗施-帕甘检验(B-P检验)
B-P检验同样有简化的命令:
- #只有一个解释变量时
- estat hettest X
-
- #有多个解释变量时,iid为独立同分布
- estat hettest X1 X2,iid
或者我们通过具体步骤进行B-P检验:
- #首先,算出残差平方和
- predict e,residuals
- gen r2 = e^2
-
- #其次,进行辅助式回归
- quietly reg r2 X1 X2 #quietly,回归但不显示
- di"LM统计量="e(N)*e(r2) #算LM统计量,LM近似服从卡方分布,N为数据长度,r2为辅助回归中拟合优度
- di "5%的卡方分布临界值="invchi2tail(e(df_m),.05) #计算5%的临界水平的卡方分布临界值
- di"LM的P值="chi2tail(e(df_m),e(N)*e(r2)) #计算LM统计量对应的P值
-
算出来的“LM的P值”小于5% 或 “LM统计量”大于“"5%的卡方分布临界值”时,拒接原假设,即为异方差。
③怀特检验(White检验)
White检验的有着非常方便的命令,且受约束小,一般首选White检验去进行异方差检验:
estat imtest,white
补充
关于异方差检验还有第四种方法,即G-Q检验。
G-Q检验不像B-P检验和White检验那样拥有直接命令,因此需要手动进行命令执行,在这里就敲了,有需要的,可以私信。
新手小白上路,大家相互学习,相互讨论。
以上代码可以直接复制食用(如果不删除注释,请将#改为*)。如代码出现问题请帮忙指出,相互进步!!
文章知识点与官方知识档案匹配,可进一步学习相关知识
算法技能树首页概览42750 人正在系统学习中