當前位置: 華文星空 > 知識

計量經濟學中為什麽要對變量取對數,差分以及對數差分?

2015-06-28知識

Why 取對數?

(1) 縮小數據之間的絕對差異;避免個別極端值的影響

(2) 盡可能滿足經典線性模型假定( classic Linear Model)

  • 避免共線性
  • 避免異變異數,滿足同變異數基本假定
  • 盡可能符合正態分布
  • (3) 經濟學意義

  • 用線性模型估計非線性關系 比如,考慮教育回報方程式,相比於「每多接受一年教育,增加的薪金相同」,「每多接受一年教育,薪金增長的百分數相同」更合理。具體而言,相比於「每多接受一年教育,小時薪金都增加 54 美分」,「每多接受一年教育,薪金都增長 8%」更合理。因為後者更能刻畫薪金增長量隨受教育程度的增加而增加的規律,即教育回報遞增,受教育程度對薪金水平的偏效應隨著受教育程度的增加而增加(見 Wooldridge 的 Introductory Econometrics,2009,4e,pp.43)。
  • 直接估計彈性/半彈性 彈性是經濟學中一個重要指標,衡量了一個變量的百分比變動會導致另一個變量百分比變動的程度。半彈性,即因變量取對數,自變量不取,表示自變量變動一個單位引起因變量多少的百分比變化。 比如產出對資本和工人勞動時間回歸,變量都取對數。
  • \begin{gathered} \ln (\text { 產量 } Y)=\alpha_{0}+\alpha_{1} \ln (\text { 資本 } K)+\alpha_{2} \ln (\text { 勞動時間 } L) \\ \frac{\partial \ln (Y)}{\partial \ln (K)}=\frac{\frac{\partial Y}{Y}}{\frac{\partial K}{K}}=\frac{K}{Y} \frac{\partial Y}{\partial K}=\epsilon_{Y K} \end{gathered} \\

    因此 \alpha_{1} 就表示資本變化 1 \% , 產量變動百分之 100 * \epsilon_{Y K} \% , 則 \alpha_{1} 表示彈性。

  • 取對數背後的經濟理論模型 " 上述這個例子中,如果背後假設的是 CD 生產函數。
    Y=e^{\alpha_{0}} K^{\alpha_{1}} L^{\alpha_{2}} \\ 其中, e^{\alpha_{0}} 是全要素生產率,在 \alpha_{0} 上加一個擾動,再兩端取對數即回歸模型, 由此, 回歸方程式式裏的參數都能對應到模型中的參數,此時, 回歸從一個 reduced-form 變為了 structural-form 。
  • 經濟理論模型中,某些變量本身就以對數形式存在,則應取對數 比如,勞動經濟學中研究教育投資回報率的決定因素,通常以薪金對數為被解釋變量,這是從 Mincer 模型推匯出來的。
  • 為更便於研究,可能會取對數。
  • How 取對數?

  • 當數據均為正數時,可直接取對數;當數據為非負數據,且有較多 0 時,可 ln(x+1),盡可能保留更多的樣本;當數據存在負數時,可能需要再看一下數據本身是否存在問題,此時沒法直接取對數。
  • Stata 中,log(·)和 ln(·)都以自然對數為底。如果要換底,比如 log10(·)表示以 10 為底。
  • 如何解釋估計系數?

    取對數意味著什麽?

    將 \log (y) 在 y_{0} 處 Taylor 展開,

    \begin{gathered} \log (y)=\log \left(y_{0}\right)+\frac{1}{y_{0}}\left(y-y_{0}\right) \\ \Rightarrow \Delta \log (y)=\frac{\left(y-y_{0}\right)}{y_{0}} \\ \Rightarrow 100 * \Delta \log (y) \approx \% \Delta y \end{gathered} \\

    可發現,取對數後的變量的變動(變量對數的變動*100)近似等於變量的百分比變動 (增長率)。

    對數-水平模型:Y 取對數 \beta_{1} 的解釋,考慮度量單位變換

    (1) 簡單估計

    考慮薪金方程式

    \log (w a g e)=\beta_{0}+\beta_{1} e d u c+u \\

    估計系數 \beta_{1} 的解釋可從下式中獲知:

    \begin{gathered} \Delta \log (w a g e)=\beta_{1} \Delta e d u c \\ \% \Delta w a g e \approx\left(100 \cdot \beta_{1}\right) \Delta e d u c \end{gathered} \\

    即每多接受一年教育,薪金將增加 100 * \beta_{1} \% 。 NB 變量對數的變動* 100 近似變量的百分比變動, 上式等式左側 * 100, 根據度量單位變 換相關知識, 解釋估計系數 \beta_{1} 時也要 * 100 。

    (2) 精確估計

    如果要精確估計 x 變動一單位, y 變動多少,則考慮

    \begin{gathered} \log \left(y_{1}\right)-\log \left(y_{0}\right)=\beta_{1} \Delta x \\ \log \left(\frac{y_{1}}{y_{0}}\right)=\beta_{1} \Delta x \\ \frac{y_{1}-y_{0}}{y_{0}}=\exp \left(\beta_{1}\right)-1 \\ \% \Delta y=100 *\left[\exp \left(\beta_{1}\right)-1\right] \end{gathered} \\

    (3) 舉例

    \log \widehat{(\text { wage })}=0.584+0.083 $educ$ \\

    其中,0.083 意味著每多受一年教育將帶來小時薪金增長 8.3% ; 而精確估計下,多受一年 教育將帶來小時薪金增長 8.65% 。

    當 X 為啞變量時 現在,我們研究這樣一個問題 : 年輕的時候上私立學校到底會不會對之後的勞動回報產生影響?

    最簡單的思路是觀察這樣一個回歸模型:

    \ln Y_{i}=\alpha+\beta P_{i}+e_{i} \\

    其中 Y_{i} 表示 i 參加工作之後的薪金水平, P_{i} 等於 1 意味著年輕的時候瀆私立學校, 0 意味著讀公立學校, e_{i} 則代表了影響 薪金的經濟學家觀測不到的其它因素, 如個人能力。

    上述模型,在「其它變量保持不變的情況下",一個年輕時候讀私立學校的員工工作之後的收入是:

    \ln Y_{i, P_{i}=1}=\alpha+\beta+e_{i} \\

    而一個年輕時候讀公立學校的員工參加工作之後的收入是:

    \ln Y_{i, P_{i}=0}=\alpha+e_{i} \\

    模型對於系數 \beta 的解釋是讀公立學校和讀私立學校給員工 i 的收入帶來的潛在影響差:

    \ln Y_{i, P_{i}=1}-\ln Y_{i, P_{i}=0}=\beta \\

    這意味著系數 \beta 具備的意義是:

    \beta=\ln \frac{Y_{i, P_{i}=1}}{Y_{i, P_{i}=0}}=\ln \left(1+\frac{Y_{i, P_{i}=1}-Y_{i, P_{i}=0}}{Y_{i, P_{i}=0}}\right)=\ln \left(1+\Delta \% Y_{p}\right) \approx \Delta \% Y_{p} \\

    也就是說 : 當找們把輸出變量取對數時,所得到的模型估計的結果近似告訴我們相比讀公立學校,私立學校對未來收入造成的百分比影響。

    水平-對數模型:X 取對數 一個 X 取對數, Y 為百分數的例子 研究學校規模對學生成績的影響, 估計出如下模型 (見 Wooldridge 的 Introductory Econometrics, 2009, 4e, pp.126-128) 。

    \widehat{m a t h 1} 0=-207.66+21.16 \log (\text { totcomp })+3.98 \log (s t a f f)-1.29 \log (\text { enroll }) \\

    其中, m a t h 10 表示標準化十分制數學測驗透過百分比, t o t \operatorname{com} p 年均教師薪資; s t a f f 平均每幹名學生擁有的教職工 人數; e n r o l l 表示學校註冊人數,用以衡量學校規模。 如何解釋- 1.29 這一估計系數呢? \mathrm{NB} \times 取對數後,要解釋為 x 的百分比變動,則意味著解釋變量的度量單位乘以 100 , 則估計系數的解釋要除以 100。

    \Delta \widehat{\text { math } 10} \approx-(1.29 / 100)(\% \Delta \text { enroll }) \approx-0.013(\% \Delta \text { enroll }) \\

    可以解釋為, 學校註冊人數每增加 10 \% , 預計數學測驗透過率將下降 0.13 個百分點(註意, matp0 為百分比,取值 35.3 則表示 35.3 \% 的學生透過測驗) 。

    詳細內容參見連享會推文

  • 專題: 數據處理
  • 取對數!取對數?
  • 相關推文

    Note:產生如下推文列表的 Stata 命令為:
    . lianxh 系數
    . songbl 系數
    安裝最新版 lianxh / songbl 命令:
    . ssc install lianxh, replace
    . ssc install songbl, replace
  • 專題: Stata 教程
  • Stata:各類集中度指數估算-廣義基尼 Gini 系數

  • 專題: Stata 繪圖
  • forest-森林圖:分組回歸系數視覺化
  • Stata 繪圖:回歸系數視覺化-論文更出彩
  • Stata 繪圖:隨機推斷中的系數視覺化
  • 專題: 結果輸出
  • Stata 結果輸出:pwcorr_a 輸出相關系數矩陣
  • pwcorr_a:輸出相關系數矩陣至 Word 和 Excel
  • Stata:回歸結果中不報告行業虛擬變量的系數

  • 專題: 回歸分析
  • 0.0005:估計系數太小怎麽辦?
  • Stata:系數為何不顯著?GIF-演示-OLS-的性質.md
  • 正確姿勢:回歸系數的解釋與評估
  • Stata: 即時估計個股Beta(beta)系數
  • 多元回歸系數:我們都解釋錯了?
  • 圖示線性回歸系數:Frisch-Waugh 定理與部份回歸圖
  • Stata: 如何檢驗分組回歸後的組間系數差異?
  • 如何比較解釋變量的系數相對大小?
  • Stata: 獲取分組回歸系數的三種方式
  • 專題: 面板數據
  • 異質性分析:系數平滑可變模型
  • 面板變系數模型:每家公司都有一個斜率

  • 專題: IV-GMM
  • IV-工具變量法:第一階段系數符號確定時的小樣本無偏估計
  • 專題: 時間序列
  • DCC-MGARCH:動態條件相關系數模型 (R+Stata)
  • CCC-MGARCH:常值條件相關系數模型 (R+Stata)

  • 專題: 風險管理
  • Stata:普通年金現值系數表