Why 取對數?
(1) 縮小數據之間的絕對差異;避免個別極端值的影響
(2) 盡可能滿足經典線性模型假定( classic Linear Model)
(3) 經濟學意義
\begin{gathered} \ln (\text { 產量 } Y)=\alpha_{0}+\alpha_{1} \ln (\text { 資本 } K)+\alpha_{2} \ln (\text { 勞動時間 } L) \\ \frac{\partial \ln (Y)}{\partial \ln (K)}=\frac{\frac{\partial Y}{Y}}{\frac{\partial K}{K}}=\frac{K}{Y} \frac{\partial Y}{\partial K}=\epsilon_{Y K} \end{gathered} \\
因此 \alpha_{1} 就表示資本變化 1 \% , 產量變動百分之 100 * \epsilon_{Y K} \% , 則 \alpha_{1} 表示彈性。
Y=e^{\alpha_{0}} K^{\alpha_{1}} L^{\alpha_{2}} \\ 其中, e^{\alpha_{0}} 是全要素生產率,在 \alpha_{0} 上加一個擾動,再兩端取對數即回歸模型, 由此, 回歸方程式式裏的參數都能對應到模型中的參數,此時, 回歸從一個 reduced-form 變為了 structural-form 。
How 取對數?
如何解釋估計系數?
取對數意味著什麽?
將 \log (y) 在 y_{0} 處 Taylor 展開,
\begin{gathered} \log (y)=\log \left(y_{0}\right)+\frac{1}{y_{0}}\left(y-y_{0}\right) \\ \Rightarrow \Delta \log (y)=\frac{\left(y-y_{0}\right)}{y_{0}} \\ \Rightarrow 100 * \Delta \log (y) \approx \% \Delta y \end{gathered} \\
可發現,取對數後的變量的變動(變量對數的變動*100)近似等於變量的百分比變動 (增長率)。
對數-水平模型:Y 取對數 \beta_{1} 的解釋,考慮度量單位變換
(1) 簡單估計
考慮薪資方程式
\log (w a g e)=\beta_{0}+\beta_{1} e d u c+u \\
估計系數 \beta_{1} 的解釋可從下式中獲知:
\begin{gathered} \Delta \log (w a g e)=\beta_{1} \Delta e d u c \\ \% \Delta w a g e \approx\left(100 \cdot \beta_{1}\right) \Delta e d u c \end{gathered} \\
即每多接受一年教育,薪資將增加 100 * \beta_{1} \% 。 NB 變量對數的變動* 100 近似變量的百分比變動, 上式等式左側 * 100, 根據度量單位變 換相關知識, 解釋估計系數 \beta_{1} 時也要 * 100 。
(2) 精確估計
如果要精確估計 x 變動一單位, y 變動多少,則考慮
\begin{gathered} \log \left(y_{1}\right)-\log \left(y_{0}\right)=\beta_{1} \Delta x \\ \log \left(\frac{y_{1}}{y_{0}}\right)=\beta_{1} \Delta x \\ \frac{y_{1}-y_{0}}{y_{0}}=\exp \left(\beta_{1}\right)-1 \\ \% \Delta y=100 *\left[\exp \left(\beta_{1}\right)-1\right] \end{gathered} \\
(3) 舉例
\log \widehat{(\text { wage })}=0.584+0.083 $educ$ \\
其中,0.083 意味著每多受一年教育將帶來小時薪資增長 8.3% ; 而精確估計下,多受一年 教育將帶來小時薪資增長 8.65% 。
當 X 為啞變量時 現在,我們研究這樣一個問題 : 年輕的時候上私立學校到底會不會對之後的勞動報酬產生影響?
最簡單的思路是觀察這樣一個回歸模型:
\ln Y_{i}=\alpha+\beta P_{i}+e_{i} \\
其中 Y_{i} 表示 i 參加工作之後的薪資水平, P_{i} 等於 1 意味著年輕的時候瀆私立學校, 0 意味著讀公立學校, e_{i} 則代表了影響 薪資的經濟學家觀測不到的其它因素, 如個人能力。
上述模型,在「其它變量保持不變的情況下",一個年輕時候讀私立學校的員工工作之後的收入是:
\ln Y_{i, P_{i}=1}=\alpha+\beta+e_{i} \\
而一個年輕時候讀公立學校的員工參加工作之後的收入是:
\ln Y_{i, P_{i}=0}=\alpha+e_{i} \\
模型對於系數 \beta 的解釋是讀公立學校和讀私立學校給員工 i 的收入帶來的潛在影響差:
\ln Y_{i, P_{i}=1}-\ln Y_{i, P_{i}=0}=\beta \\
這意味著系數 \beta 具備的意義是:
\beta=\ln \frac{Y_{i, P_{i}=1}}{Y_{i, P_{i}=0}}=\ln \left(1+\frac{Y_{i, P_{i}=1}-Y_{i, P_{i}=0}}{Y_{i, P_{i}=0}}\right)=\ln \left(1+\Delta \% Y_{p}\right) \approx \Delta \% Y_{p} \\
也就是說 : 當找們把輸出變量取對數時,所得到的模型估計的結果近似告訴我們相比讀公立學校,私立學校對未來收入造成的百分比影響。
水平-對數模型:X 取對數 一個 X 取對數, Y 為百分數的例子 研究學校規模對學生成績的影響, 估計出如下模型 (見 Wooldridge 的 Introductory Econometrics, 2009, 4e, pp.126-128) 。
\widehat{m a t h 1} 0=-207.66+21.16 \log (\text { totcomp })+3.98 \log (s t a f f)-1.29 \log (\text { enroll }) \\
其中, m a t h 10 表示標準化十分制數學測驗透過百分比, t o t \operatorname{com} p 年均教師薪資; s t a f f 平均每幹名學生擁有的教職工 人數; e n r o l l 表示學校註冊人數,用以衡量學校規模。 如何解釋- 1.29 這一估計系數呢? \mathrm{NB} \times 取對數後,要解釋為 x 的百分比變動,則意味著解釋變量的度量單位乘以 100 , 則估計系數的解釋要除以 100。
\Delta \widehat{\text { math } 10} \approx-(1.29 / 100)(\% \Delta \text { enroll }) \approx-0.013(\% \Delta \text { enroll }) \\
可以解釋為, 學校註冊人數每增加 10 \% , 預計數學測驗透過率將下降 0.13 個百分點(註意, matp0 為百分比,取值 35.3 則表示 35.3 \% 的學生透過測驗) 。
詳細內容參見連享會推文
相關推文
Note:產生如下推文列表的 Stata 命令為:
. lianxh 系數
. songbl 系數
安裝最新版
lianxh
/
songbl
命令:
. ssc install lianxh, replace
. ssc install songbl, replace