迴歸分析中15個統計量詳解

迴歸分析中15個統計量詳解

01 迴歸係數

注意迴歸係數的正負要符合理論和實際。截距項的迴歸係數無論是否通過T檢驗都沒有實際的經濟意義。

02 迴歸係數的標準差

標準誤差越大,迴歸係數的估計值越不可靠,這可以通過T值的計算公式可知(自查)。

03 T檢驗

T值檢驗迴歸係數是否等於某一特定值,在迴歸方程中這一特定值為0,因此T值=迴歸係數/迴歸係數的標準誤差,因此T值的正負應該與迴歸係數的正負一致,迴歸係數的標準誤差越大,T值越小,迴歸係數的估計值越不可靠,越接近於0。另外,迴歸係數的絕對值越大,T值的絕對值越大。

04 P值

P值為理論T值超越樣本T值的概率,應該聯繫顯著性水平α相比,α表示原假設成立的前提下,理論T值超過樣本T值的概率,當P值

05 可決係數(R-squared)

都知道可決係數表示解釋變量對被解釋變量的解釋貢獻,其實質就是看(y尖-y均)與(y=y均)的一致程度。y尖為y的估計值,y均為y的總體均值。

06 調整後的可決係數

即經自由度修正後的可決係數,從計算公式可知調整後的可決係數小於可決係數,並且可決係數可能為負,此時說明模型極不可靠。

07 迴歸殘差的標準誤

殘差的經自由度修正後的標準差,OLS的實質其實就是使得均方差最小化,而均方差與此的區別就是沒有經過自由度修正。

08 對數似然估計函數值

首先,理解極大似然估計法。極大似然估計法雖然沒有OLS運用廣泛,但它是一個具有更強理論性質的點估計方法。極大似然估計的出發點是已知被觀測現象的分佈,但不知道其參數。極大似然法用得到觀測值(樣本)最高概率(離散分佈以概率聚集函數表示,連續分佈以概率密度函數表示。因為要使得樣本中所有樣本點都出現,假定抽樣是隨機的則各個樣本點的是獨立同分布的,所以最後總的概率表現為概率聚集函數或者概率密度函數的連乘形式,稱之為似然函數。要取最大概率,即將似然函數對未知參數求導令導數等於0即可獲得極大似然函數。一般為簡化函數的處理過程都會對似然函數進行對數化處理,這樣最後得到的極大似然函數就稱之為對數極大似然函數)的那些參數的值來估計該分佈的參數,從而提供一種用於估計刻畫一個分佈的一組參數的方法。

其次,理解對數似然估計函數值。對數似然估計函數值一般取負值,實際值(不是絕對值)越大越好。第一,基本推理。對於似然函數,如果是離散分佈,最後得到的數值直接就是概率,取值區間為0-1,對數化之後的值就是負數了;如果是連續變量,因為概率密度函數的取值區間並不侷限於0-1,所以最後得到的似然函數值不是概率而只是概率密度函數值,這樣對數化之後的正負就不確定了。第二,Eviews的計算公式解釋。公式值的大小關鍵取之於殘差平方和(以及樣本容量),只有當殘差平方和與樣本容量的比之很小時,括號內的值才可能為負,從而公式值為正,這時說明參數擬合效度很高;反之公式值為負,但其絕對值越小表示殘差平方和越小,因而參數擬合效度越高。

09 DW檢驗值

DW統計量用於檢驗序列的自相關,公式就是測度殘差序列與殘差的滯後一期序列之間的差異大小,經過推導可以得出DW值與兩者相關係數的等式關係,因而很容易判斷。DW值的取值區間為0-4,當DW值很小時(大致<1)表明序列可能存在正自相關;當DW值很大時(大致>3)表明序列可能存在負自相關;當DW值在2附近時(大致在1.5到2.5之間)表明序列無自相關;其餘的取值區間表明無法確定序列是否存在自相關。當然,DW具體的臨界值還需要根據樣本容量和解釋變量的個數通過查表來確定。

DW值並不是一個很適用的檢驗手段,因為它存在苛刻的假設條件:解釋變量為非隨機的;隨機擾動項為一階自迴歸形式;解釋變量不能包含滯後的被解釋變量;必須有截距項;數據無缺失值。當然,可以通過DW-h檢驗來檢驗包含滯後被解釋變量作為解釋變量的序列是否存在自相關。h統計量與滯後被解釋變量的迴歸係數的方差呈正相關關係,可以消除其影響。

10 被解釋變量的樣本均值

被解釋變量的樣本均值

(Mean Dependent Var)

11 被解釋變量的樣本標準誤差

被解釋變量的樣本標準誤差(S.D.Dependent Var)

12 赤池信息準則(AIC)

AIC和SC在時間序列分析過程中的滯後階數確定過程中非常重要,一般是越小越好。

一般理解:根據AIC的計算公式(-2*L/N+2*k/N,L為對數似然估計函數值,k為滯後階數,N為樣本容量)可知:當滯後階數小時,2*k/N小,但因為模型的模擬效果會比較差所以L(負值)會比較小,加上負號之後則變得較大,因此最後的AIC有可能較大;當滯後階數大時,模型的模擬效果會比較好所以L(負值)會比較大,加上負號之後則變得較小,但是2*k/N過大(損失自由度的代價),因此最後的AIC也有可能較大。綜上,AIC較小意味著滯後階數較為合適。

13 施瓦茨信息準則(SC)

與AIC沒有任何本質區別,只是加入樣本容量的對數值以修正損失自由度的代價。

14 F統計量(F-statistic)

F統計量考量的是所有解釋變量整體的顯著性,所以F檢驗通過並不代表每個解釋變量的t值都通過檢驗。當然,對於一元線性迴歸,T檢驗與F檢驗是等價的。

15 prob(F-statistic)

F統計量的P值,一切的P值都是同樣的實質意義。


分享到:


相關文章: