時間序列分析之預測中國GDP走勢(STATA版)

之前已經給大家推送了一篇文章——時間序列分析

,在這篇文章中通過語音的方式介紹了時間序列分析的簡單概念,不瞭解時間序列分析的可以去看這篇文章。

2月底我在網易雲課堂新上線了《STATA統計分析》課程,昨天新錄製了一個時間序列分析的案例,增補到課程裡面。在該案例中,講解了如何使用 ARIMA模型,迴歸模型,非季節性Holt-Winters平滑,對數-ARIMA模型這四種方法來預測中國未來GDP走勢,本文通過文字的方式簡單介紹一下其中ARIMA建模的過程,這四種方法完整建模過程以及建模效果的評估,可點擊文末閱讀原文查看課程。在【時間序列分析】章節,課程小節名稱為案例【案例1-中國未來GDP預測

一 、數據預處理

首先,來觀察一下中國GDP的增長曲線:該曲線表明,中國的GDP增長大致呈現出一種指數增長趨勢,很明顯這不是一個平穩的時間序列,在時間序列分析這篇文章中,已經介紹過,時間序列建模,一般要求,序列是平穩的。

时间序列分析之预测中国GDP走势(STATA版)

對於這種指數型增長的時間序列,可以使用對數轉換+一階差分或者直接使用二階差分的方式轉換成平穩序列。

  • 使用對數轉換+一階差分轉換後的時間序列圖:

时间序列分析之预测中国GDP走势(STATA版)
  • 直接進行二階差分轉換後的時間序列圖:

时间序列分析之预测中国GDP走势(STATA版)

通過觀察圖形,發現轉換後的序列趨勢基本消除,只是呈現出一定的波動性,為更加嚴謹,需要使用單位根檢驗,這樣可以通過統計檢驗的形式嚴格檢驗轉換後的序列是否為平穩序列。下圖中,給出了對gdp原始變量以及對

二階差分轉換後的變量進行單位根檢驗的結果,gdp原始變量的檢驗結果p值為1,表明完全接受原假設(單位根檢驗的原假設是:被檢驗序列是一個包含單位根的非平穩序列);對數轉換再差分的變量檢驗結果的p值為0.0000,小於0.05,拒絕原假設,表明轉換後的序列已經是一個平穩序列了。

时间序列分析之预测中国GDP走势(STATA版)

二、建立ARIMA模型

此處介紹對二次差分後的變量進行建模的過程。對上述二次差分處理後的時間序列繪製自相關圖以及偏自相關圖。

  • 自相關圖

时间序列分析之预测中国GDP走势(STATA版)
  • 偏自相關圖

时间序列分析之预测中国GDP走势(STATA版)

通過這裡的自相關圖和偏自相關圖,很難確定合適的arima模型參數(因為自相關圖和偏自相關圖的模式不明顯),我們可以嘗試不同的參數,並使用赤池信息準則,也就是根據AIC統計量判斷模型好壞,取AIC取值最小的模型最為最終模型。

這裡我通過計算得到如下的一批模型以及它們的AIC取值,可以發現模型 arima(2,2,1) 是此處的最優模型(因為其AIC取值最小)。

模型 AIC

arima(0,2,1) 1294

arima(0,2,2) 1279

arima(0,2,3) 1273

arima(1,2,0) 1297

arima(2,2,0) 1282

arima(3,2,0) 1276

arima(1,2,1) 1290

arima(2,2,1) 1270

arima(2,2,2) 1271

三、使用上述模型進行預測

得到arima模型後,將利用此arima模型進行預測,stata中使用arima模型只能預測未來一期的數值。 計算預測值,注意需要在後面加上選項“y”,此處我們建立的arima模型包含差分的部分,不加上“y”,預測得到的結果是二階差分作為因變量而得到的預測值。

predict y1,y

label variable y1 "arima"

預測得到的2017年的GDP數值為795095.19(億元),發這篇文章時,2017年GDP統計結果還未公佈,公佈後,大家可以對比一下。課程中一共講解了4種模型,觀看課程的同學也可以對比一下這四種模型,誰的預測效果更好。

此處將建立的arima模型的預測效果用圖形展示出來:發現吻合度還是很高的。

时间序列分析之预测中国GDP走势(STATA版)

四、殘差的檢驗

下面這張圖展示的是課程裡面演示的4種預測方法所得結果的殘差:可以發現殘差基本是平穩序列,且就殘差來看,建立的arima模型是最優的。

时间序列分析之预测中国GDP走势(STATA版)

限於篇幅,本文主要給出的是建模思路以及一些關鍵要點,詳細代碼,建模原理,操作細節等內容,請點擊閱讀原文查看課程的【時間序列分析】章節,其中案例1-中國未來GDP預測

對應於本文的內容。作為收費課程,其內容肯定是比此處的公益性推文內容要更加豐富的。


分享到:


相關文章: