當前位置: 華文星空 > 知識

在統計學中為什麽要對變量取對數?

2013-11-12知識

對數變化可以看做是Box-Cox變換的一種特例,轉換目的是讓數值更加接近標準的正態分布 。我們知道有很多統計檢驗的前提條件是數據近似符合正態分布,但是在絕大多數場景下我們接觸到的數據都是呈現肥尾特征的。下圖展示了包鋼股份2015年至今的股價分布,我們可以看到取對數明顯緩解了原數值右偏的情況。

Box-Cox變換相傳是George Box和David Cox第一次見面時因為名字相近又同為英國人決定合作一篇文章,因此就誕生了這個經典的轉換,可以看到對數變換是Box-Cox的一種特例:

那Box-Cox轉換中的參數lambda該如何取值呢? 對於右偏(長尾在右側)的數據lambda取小於0,左偏的數據lambda取大於0 ,背後的原因我們先透過下圖來理解一下為什麽對數函數能夠緩解數據右偏的問題。對數函數的左側更陡,因此原數據取對數之後左側的間隔放大,右側的間隔縮小,右邊的長尾因此變得不那麽明顯了。

不同的lambda取值得到的函數影像如下圖:

從圖中可以看到lambda小於0時左側更陡,所以適合解決右偏的問題,反之lambda大於0時右側更陡,所以適合解決左偏的問題。並且lambda的絕對值越大,對原數值的調整更明顯。