Hausman 检验是干嘛的呀 幼儿园招聘保育员是干嘛的呀知乎
Hausman 检验是干嘛的呀
本文是《面板数据、工具变量选择和HAUSMAN检验的若干问题》中的一部分,来自:http://read.freeduan.com/article/show-32502-1.html
原作者名字不详。
参见Statacorporation,2001,STATA7ReferenceH-P,StataPress
1,含义:“Thenullhypothesisisthattheefficientestimatorisaconsistentandefficientestimatorofthetrueparameters.Ifitis,thereshouldbenosystematicdifferencebetweenthecoefficientsoftheefficientestimatorandacomparisonestimatorthatisknowntobeconsistentforthetrueparameters.Ifthetwomodelsdisplayasystematicdifferenceintheestimatedcoefficients,thenwehavereasontodoubttheassumptionsonwhichtheefficientestimatorisbased.”参见手册Statacorporation,2001,STATA7ReferenceH-P,StataPress。该方法是Hausman(1978)的程序化。所以,HausmanTest的命令(hausman)假设使用者知道需要比较的两个方程中哪一个是“无论原假说成立与否都是consistent”,哪一个“在原假说下不仅efficient而且consistent,但若原假说不成立,则inconsistent”,[1]然后,在STATA8下,步骤是:
(1)obtainanestimatorthatisconsistentwhetherornotthehypothesisistrue
(2)storetheestimationresultsunderaname-consistentusingestimatesstore
(3)obtainanestimatorthatisefficient(andconsistent)underthehypothesisthat
youaretesting,butinconsistentotherwise
(4)storetheestimationresultsunderaname-efficientusingestimatesstore
(5)usehausmantoperformthetest
hausmanname-consistentname-efficient[,options]
举例:
(1)在关于是FE还是RE的检验中,原假说是非观测效应与解释变量不相关,备择假说是两者相关。FE是无论原假说成立与否都是consistent,而RE在原假说下是consistent,并且Asymptoticallyefficient(样本越大越有效),但如果原假说被拒绝,则RE不是consistent的(Hausman,1978)。所以做法应该是(STATA8的命令):
sortcodeyear(排序)
tisyear(时间变量是year)
iiscode(表示单位的是code)
xtregyxx2,fe(假设其中x是需要被工具的变量)
eststorefixed(在STATA8里命令有变化,不再是HAUSMAN,SAVE了,这里的fixed实际上就是个变量名,用什么都行)
xtregyxx2,re
hausmanfixed
(2)比较OLS(或FE)和IV(或IVFE)
先做IV,因为,它无论如何都是consistent的,但OLS只有在原假设成立,即OLS结果与IV结果相同,内生性问题没有时,才是consistent的。所以,应该先做IV。
在老版本的STATA里,如果不加特殊说明,STATA就会默认为先写的回归命令得到的是总是一致的估计结果,后写的得到的是备择假设下不一致的估计结果。现在HAUSMAN命令规范了,而且扩展了。先跑哪个不重要,关键在于写最后HAUSMAN命令时候的顺序,而且如果最近跑的一个没有用EST存名字的话,要用“.”代替。
Appendix:
(1)Thedefinitionofunbiased,consistentandefficient.
关于这一部分的一些概念详细说明:
参数估计无偏是指参数估计量的均值或期望值等于参数真值,偏倚是两者的差异;
参数估计效率(有效性)是指参数估计量的离散程度或精度,用参数估计量对其期望值的方差表示;
参数估计的一致性指当样本容量趋向无穷大时,参数估计(无偏或者有偏)趋近于参数真值,也就是收敛于参数真值。
一般来说,参数估计的评价首先看无偏性,再比较有效性,这是评价参数估计量优劣的两个主要准则。两个无偏的估计量,方差比较小的估计量效率(精度)更高。
不过,在很多情况下,我们必须在估计量的偏差和方差之间做一定的选择。比如如果我们建模的目的是使预测精确度最大,方差很小而有偏差的估量可能比无偏而方差大的估计量要更好一些。在这种情况下,一个很有用的标准是比较参数估计的均方误差(也有翻译成平均偏差平方),小的比较好(均方误差最小准则)。
均方误差是同时考虑无偏性(偏倚)和有效性(精度)的指标,用参数估计值与真实值的偏差平方表示(不同于参数估计的方差是参数估计对其期望的偏差平方)。均方误差可以分解为参数估计值的方差(有效性)和其期望对参数真值的偏差(无偏性)两部分。。当参数估计是无偏时,第二部分为零,均方误差就剩第一部分,等价于参数估计的方差。
均方误差由于同时考虑无偏程度和有效性,不仅可以用于无偏估计之间的比较,而且可以用于无偏估计和有偏估计之间的比较。而用有效性来评价估计优劣一般来说首先需要两个估计都是无偏的。
均方误差趋向于0意味着估计量是渐进无偏的,并且当样本容量非常大时,它的方差趋于0。事实上均方误差趋于0的估计量是一致估计量。
因此,如果遵循均方误差最小的准则来评价参数估计,那么,一个无偏的但当样本容量增大时始终对真值有比较大的离散度的参数估计,还不如一个有偏但均方误差更小的估计量更令人放心。
lyunsun:公式在这里没办法显示。需要了解具体过程的请阅读相关基础计量经济学书籍,个人推荐Stock&Watson的IntroductionitoEconometrics(英文影印版,上海财经大学出版社)或者Woodridge的计量经济学导论(英文影印版,清华大学出版社)。或者GREEN的EconometricAnalysis等高级计量经济学教材。[此贴子已经被angelboy于2009-3-3013:09:17编辑过]