最近有关注到这个问题,也想发表一点自己的看法。
我是学经济学,主要做因果实证研究。在此前的几年学习中并没有接触过中介效应。第一次看到中介效应这个概念是在知乎上,看了解释后脑海里出现的第一个反应是中介效应类似于经济学实证回归里的过度控制问题。简言之,研究x对y的因果影响,z是关于x的一个方程,但事实上也影响y。一个可能不十分恰当的例子: x是学历,z是职务高低,y是收入。按照中介效应的理解,职务高低取决于学历,应当把x的偏影响和通过z作用于y的偏影响分解开来。然而,应用微观研究通常只在一个研究项目里关注一对因果效应。因为把一对因果研究透彻已经比较棘手,一般情况下需要良好的自然实验的结果才比较可信。如果回归模型里出现了两个内生变量,会变得十分复杂。按照这个观点,我们只关心x对y的总体影响,那么z进入模型会过度控制x的信息。
退一步讲,如果真的希望分解,根据我的理解,线性假设下,完美的分解需要三个自然实验(不是三个简单回归)。第一,x对y回归,保证捕捉到x对y的无偏全效应。第二,z对y回归,保证捕捉z对y的无偏估计(这一步需要去除掉x通过z作用于y的部分,感觉比较棘手)。第三,x对z回归,保证捕捉x对z的影响。辣么,第一步减第二步和第三步的乘积,可能可以分解出中介效应。因此,表面上看是简单的三个回归,其实可能需要大量的工作,甚至任何一个做好都能成一篇不错的论文。