重庆市教育评估院

混合效应模型和面板数据分析（转载）

来源：http://blog.sina.com.cn/s/blog_675b04430100x7r5.html

考虑一类混合效应模型yij=ai xiβ eij,j=1,2,…,mi,i=1,2,…,n,其中Eai=0,Eai2=σa2,Eeij=0,Eeij2=σe2.给出了参数β,σa2和σe2的估计,并证明了这些估计量的强相合性.还讨论了随机效应ai的方差为零的检验问题,给出了检验方案.

随机效应模型 random effects models　　

随机效应模型(random effects models)是经典的线性模型的一种推广，就是把原来（固定）的回归系数看作是随机变量，一般都是假设是来自正态分布。如果模型里一部分系数是随机的，另外一些是固定的，一般就叫做混合模型（mixed models）。

　　虽然定义很简单，对线性混合模型的研究与应用也已经比较成熟了，但是如果从不同的侧面来看，可以把很多的统计思想方法综合联系起来。概括地来说，这个模型是频率派和贝叶斯模型的结合，是经典的参数统计到高维数据分析的先驱，是拟合具有一定相关结构的观测的典型工具。

　　随机效应最直观的用处就是把固定效应推广到随机效应。注意，这时随机效应是一个群体概念，代表了一个分布的信息 or 特征，而对固定效应而言，我们所做的推断仅限于那几个固定的（未知的）参数。例如，如果要研究一些水稻的品种是否与产量有影响，如果用于分析的品种是从一个很大的品种集合里随机选取的，那么这时用随机效应模型分析就可以推断所有品种构成的整体的一些信息。这里，就体现了经典的频率派的思想-任何样本都来源于一个无限的群体(population)。

　　同时，引入随机效应就可以使个体观测之间就有一定的相关性，所以就可以用来拟合非独立观测的数据。经典的就有重复观测的数据，多时间点的记录等等，很多时候就叫做纵向数据(longitudinal data)，已经成为很大的一个统计分支。

　　上述两点基本上属于频率派，分析的工具也很经典，像极大似然估计，似然比检验，大样本的渐近性等。但是，应该注意到把固定的参数看做是随机变量，可是贝叶斯学派的观念。当然，mixed models 不能算是完全的贝叶斯模型，因为贝叶斯学派要把所有的未知的参数都看作是随机的。所以有人把它看做是半贝叶斯的 or 经验贝叶斯的。在这个模型上，我们可以看到两个学派很好的共存与交流，在现代的统计方法里两种学派互相结合的例子也越来越多。

　　众所周知，随机效应有压缩(shrinkage)的功能, 而且可以使模型的自由度(df) 变小。这个简单的结果，对现在的高维数据分析的发展起到了至关重要的作用。事实上，随机效应模型就是一个带惩罚(penalty)的一个线性模型，有引入正态随机效应就等价于增加的一个二次惩罚。有趣的是，著名的岭回归(ridge regression) 就是一个二次惩罚，它的提出解决了当设计矩阵不满秩时最小二乘估计（LSE）无法计算以及提高了预测能力。于是，引入随机效应或者二次惩罚就可以处理当参数个数p 大于观测个数n的情形，这是在分析高维数据时必须面对的问题。当然，二次惩罚还有一个特性，如：计算简便，能选择相关的predictors，对前面的几个主成分压缩程度较小等。

固定效应模型（fixed effects model）

固定效应模型的应用前提是假定全部研究结果的方向与效应大小基本相同，即各独立研究的结果趋于一致，一致性检验差异无显著性。因此固定效应模型适用于各独立研究间无差异，或差异较小的研究。

　　固定效应模型是指实验结果只想比较每一自变项之特定类目或类别间的差异及其与其他自变项之特定类目或类别间交互作用效果，而不想依此推论到同一自变项未包含在内的其他类目或类别的实验设计。例如：研究者想知道教师的认知类型在不同教学方法情境中，对儿童学习数学的效果有何不同，其中教师和学生的认知类型，均指场地依赖型和场地独立型，而不同的教学方法，则指启发式、讲演式、编序式。当实验结束时，研究者仅就两种类型间的交互作用效果及类型间的差异进行说明，而未推论到其他认知类型，或第四种教学方法。象此种实验研究模式，即称为固定效果模式。与本词相对者是随机效应模型（random effect model）、混合效应模型（mixed effect model）。

固定效应模型分为三种：

个体固定效应模型、时刻固定效应模型和个体时刻固定效应模型）。如果我们是对个体固定，则应选择个体固定效用模型。但是，我们还需作个体固定效应模型和混合估计模型的选择。所以，就要作F值检验。

相对于混合估计模型来说，是否有必要建立个体固定效应模型可以通过F检验来完成。

H0：对于不同横截面模型截距项相同（建立混合估计模型）。SSEr

H1：对于不同横截面模型的截距项不同（建立时刻固定效应模型）。SSEu

F统计量定义为：

F=[( SSEr - SSEu)/(T k－2)]/[ SSEu/(NT-T-k)]

其中，SSEr，SSEu分别表示约束模型（混合估计模型的）和非约束模型（个体固定效应模型的）的残差平方和（Sum squared resid）。非约束模型比约束模型多了T–1个被估参数。需要指出的是：当模型中含有k个解释变量时，F统计量的分母自由度是NT-T- k。通过对F统计量我们将可选择准确、最佳的估计模型。

在作回归时也是四步：

第一步，先作混合效应模型：在cross-section 一栏选择None ，Period也是None；Weights是cross-section Weights，然后把回归结果的Sum squared resid值复制出来，就是SSEr

第二步：作个体固定效用模型：在cross-section 一栏选择Fixed ，Period也是None；Weights是cross-section Weights，然后把回归结果的Sum squared resid值复制出来，就是SSEu

第三步：根据公式F=[( SSEr - SSEu)/(T k－2)]/[ SSEu/(NT-T-k)]。计算出结果。其中，T为年数，不管我们的数据是unbalance还是balance看observations就行了，也即Total pool (balanced) observations:的值，但是如果是balance我们也可以计算，也即是每一年的企业数的总和。比如说我们研究10年，每一年又500加企业，则NT＝10×500＝5000。K为解释变量，不含被解释变量。

第四步，根据计算出来的结果查F值分布表。看是否通过检验。检验准则：当F> Fα(T-1, NT-T-k) , α=0.01,0.05或0.1时，拒绝原假设，则结论是应该建立个体固定效应模型，反之，接受原假设，则不能建立个体固定效应模型。

面板数据分析方法步骤

步骤一：分析数据的平稳性（单位根检验）

按照正规程序，面板数据模型在回归前需检验数据的平稳性。李子奈曾指出，一些非平稳的经济时间序列往往表现出共同的变化趋势，而这些序列间本身不一定有直接的关联，此时，对这些数据进行回归，尽管有较高的R平方，但其结果是没有任何实际意义的。这种情况称为称为虚假回归或伪回归（spurious regression）。他认为平稳的真正含义是：一个时间序列剔除了不变的均值（可视为截距）和时间趋势以后，剩余的序列为零均值，同方差，即白噪声。因此单位根检验时有三种检验模式：既有趋势又有截距、只有截距、以上都无。

因此为了避免伪回归，确保估计结果的有效性，我们必须对各面板序列的平稳性进行检验。而检验数据平稳性最常用的办法就是单位根检验。首先，我们可以先对面板序列绘制时序图，以粗略观测时序图中由各个观测值描出代表变量的折线是否含有趋势项和（或）截距项，从而为进一步的单位根检验的检验模式做准备。

单位根检验方法的文献综述：在非平稳的面板数据渐进过程中,Levin andLin(1993) 很早就发现这些估计量的极限分布是高斯分布,这些结果也被应用在有异方差的面板数据中,并建立了对面板单位根进行检验的早期版本。后来经过Levin et al. (2002)的改进,提出了检验面板单位根的LLC 法。Levin et al. (2002) 指出,该方法允许不同截距和时间趋势,异方差和高阶序列相关,适合于中等维度(时间序列介于25～250 之间,截面数介于10～250 之间) 的面板单位根检验。Im et al. (1997) 还提出了检验面板单位根的IPS 法,但Breitung(2000) 发现IPS 法对限定性趋势的设定极为敏感,并提出了面板单位根检验的Breitung 法。Maddala and Wu(1999)又提出了ADF-Fisher和PP-Fisher面板单位根检验方法。

由上述综述可知，可以使用LLC、IPS、Breintung、ADF-Fisher 和PP-Fisher5种方法进行面板单位根检验。

其中LLC-T 、BR-T、IPS-W 、ADF-FCS、PP-FCS 、H-Z 分别指Levin, Lin & Chu t* 统计量、Breitung t 统计量、lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量、Hadri Z统计量，并且Levin, Lin & Chu t* 统计量、Breitung t统计量的原假设为存在普通的单位根过程，lm Pesaran & Shin W 统计量、ADF- Fisher Chi-square统计量、PP-Fisher Chi-square统计量的原假设为存在有效的单位根过程， Hadri Z统计量的检验原假设为不存在普通的单位根过程。

有时，为了方便，只采用两种面板数据单位根检验方法，即相同根单位根检验LLC（Levin-Lin-Chu）检验和不同根单位根检验 Fisher-ADF检验（注：对普通序列（非面板序列）的单位根检验方法则常用ADF检验），如果在两种检验中均拒绝存在单位根的原假设则我们说此序列是平稳的，反之则不平稳。

如果我们以T（trend）代表序列含趋势项，以I（intercept）代表序列含截距项，T&I代表两项都含，N（none）代表两项都不含，那么我们可以基于前面时序图得出的结论，在单位根检验中选择相应检验模式。

但基于时序图得出的结论毕竟是粗略的，严格来说，那些检验结构均需一一检验。具体操作可以参照李子奈的说法：ADF检验是通过三个模型来完成，首先从含有截距和趋势项的模型开始，再检验只含截距项的模型，最后检验二者都不含的模型。并且认为，只有三个模型的检验结果都不能拒绝原假设时，我们才认为时间序列是非平稳的，而只要其中有一个模型的检验结果拒绝了零假设，就可认为时间序列是平稳的。

此外，单位根检验一般是先从水平（level）序列开始检验起，如果存在单位根，则对该序列进行一阶差分后继续检验，若仍存在单位根，则进行二阶甚至高阶差分后检验，直至序列平稳为止。我们记I(0)为零阶单整，I(1)为一阶单整，依次类推，I(N)为N阶单整。

步骤二：协整检验或模型修正

情况一：如果基于单位根检验的结果发现变量之间是同阶单整的，那么我们可以进行协整检验。协整检验是考察变量间长期均衡关系的方法。所谓的协整是指若两个或多个非平稳的变量序列，其某个线性组合后的序列呈平稳性。此时我们称这些变量序列间有协整关系存在。因此协整的要求或前提是同阶单整。

但也有如下的宽限说法：如果变量个数多于两个，即解释变量个数多于一个，被解释变量的单整阶数不能高于任何一个解释变量的单整阶数。另当解释变量的单整阶数高于被解释变量的单整阶数时，则必须至少有两个解释变量的单整阶数高于被解释变量的单整阶数。如果只含有两个解释变量，则两个变量的单整阶数应该相同。

也就是说，单整阶数不同的两个或以上的非平稳序列如果一起进行协整检验，必然有某些低阶单整的，即波动相对高阶序列的波动甚微弱（有可能波动幅度也不同）的序列，对协整结果的影响不大，因此包不包含的重要性不大。而相对处于最高阶序列，由于其波动较大，对回归残差的平稳性带来极大的影响，所以如果协整是包含有某些高阶单整序列的话（但如果所有变量都是阶数相同的高阶，此时也被称作同阶单整，这样的话另当别论），一定不能将其纳入协整检验。

协整检验方法的文献综述：(1)Kao(1999)、Kao and Chiang(2000)利用推广的DF和ADF检验提出了检验面板协整的方法,这种方法零假设是没有协整关系,并且利用静态面板回归的残差来构建统计量。(2)Pedron(1999)在零假设是在动态多元面板回归中没有协整关系的条件下给出了七种基于残差的面板协整检验方法。和Kao的方法不同的是,Pedroni的检验方法允许异质面板的存在。(3)Larsson et al(2001)发展了基于Johansen(1995)向量自回归的似然检验的面板协整检验方法，这种检验的方法是检验变量存在共同的协整的秩。

我们主要采用的是Pedroni、Kao、Johansen的方法。通过了协整检验，说明变量之间存在着长期稳定的均衡关系，其方程回归残差是平稳的。因此可以在此基础上直接对原方程进行回归，此时的回归结果是较精确的。

这时，我们或许还想进一步对面板数据做格兰杰因果检验（因果检验的前提是变量协整）。但如果变量之间不是协整（即非同阶单整）的话，是不能进行格兰杰因果检验的，不过此时可以先对数据进行处理。引用张晓峒的原话，“如果y和x不同阶，不能做格兰杰因果检验，但可通过差分序列或其他处理得到同阶单整序列，并且要看它们此时有无经济意义。”

下面简要介绍一下因果检验的含义：这里的因果关系是从统计角度而言的，即是通过概率或者分布函数的角度体现出来的：在所有其它事件的发生情况固定不变的条件下，如果一个事件X的发生与不发生对于另一个事件Y的发生的概率（如果通过事件定义了随机变量那么也可以说分布函数）有影响，并且这两个事件在时间上又有先后顺序（A前B后），那么我们便可以说X是Y的原因。考虑最简单的形式，Granger检验是运用F-统计量来检验X的滞后值是否显著影响 Y（在统计的意义下，且已经综合考虑了Y的滞后值；如果影响不显著，那么称X不是Y的“Granger原因”（Granger cause）；如果影响显著，那么称X是Y的“Granger原因”。同样，这也可以用于检验Y是X的“原因”，检验Y的滞后值是否影响X（已经考虑了X 的滞后对X自身的影响）。

Eviews好像没有在POOL窗口中提供Granger causality test，而只有unit root test和cointegration test。说明Eviews是无法对面板数据序列做格兰杰检验的，格兰杰检验只能针对序列组做。也就是说格兰杰因果检验在Eviews中是针对普通的序列对(pairwise)而言的。你如果想对面板数据中的某些合成序列做因果检验的话，不妨先导出相关序列到一个组中(POOL窗口中的Proc/Make Group)，再来试试。

情况二：如果如果基于单位根检验的结果发现变量之间是非同阶单整的，即面板数据中有些序列平稳而有些序列不平稳，此时不能进行协整检验与直接对原序列进行回归。但此时也不要着急，我们可以在保持变量经济意义的前提下，对我们前面提出的模型进行修正，以消除数据不平稳对回归造成的不利影响。如差分某些序列，将基于时间频度的绝对数据变成时间频度下的变动数据或增长率数据。此时的研究转向新的模型，但要保证模型具有经济意义。因此一般不要对原序列进行二阶差分，因为对变动数据或增长率数据再进行差分，我们不好对其冠以经济解释。难道你称其为变动率的变动率？

步骤三：面板模型的选择与回归

面板数据模型的选择通常有三种形式：

一种是混合估计模型（Pooled Regression Model）。如果从时间上看，不同个体之间不存在显著性差异；从截面上看，不同截面之间也不存在显著性差异，那么就可以直接把面板数据混合在一起用普通最小二乘法（OLS）估计参数。一种是固定效应模型（Fixed Effects Regression Model）。如果对于不同的截面或不同的时间序列，模型的截距不同，则可以采用在模型中添加虚拟变量的方法估计回归参数。一种是随机效应模型（Random Effects Regression Model）。如果固定效应模型中的截距项包括了截面随机误差项和时间随机误差项的平均效应，并且这两个随机误差项都服从正态分布，则固定效应模型就变成了随机效应模型。

在面板数据模型形式的选择方法上，我们经常采用F检验决定选用混合模型还是固定效应模型，然后用Hausman检验确定应该建立随机效应模型还是固定效应模型。

检验完毕后，我们也就知道该选用哪种模型了，然后我们就开始回归：在回归的时候，权数可以选择按截面加权（cross-section weights）的方式，对于横截面个数大于时序个数的情况更应如此，表示允许不同的截面存在异方差现象。估计方法采用PCSE（Panel Corrected Standard Errors，面板校正标准误）方法。Beck和Katz(1995)引入的PCSE估计方法是面板数据模型估计方法的一个创新，可以有效的处理复杂的面板误差结构，如同步相关，异方差，序列相关等，在样本量不够大时尤为有用。