現實世界中的數據科學, 如何對黃金價格建模

使用領域知識和監督學習模型來理解和預測金價

現實世界中的數據科學, 如何對黃金價格建模

> Photo by Dmitry Demidko on Unsplash

在本文中,我將通過依次介紹以下項目為您提供一個非常簡單但功能強大的黃金價格模型:

· 黃金的歷史和當前用途;

· 理論上影響金價的因素;

· 用於預測黃金價格的迴歸模型;

· 迴歸模型在做出投資決策中的應用。

對於忙碌的讀者,本文還在附錄中提供了TL; DR,以及免責聲明,簡明的Jupyter筆記本和來源列表。

1.為什麼我們需要黃金?

公元前3600年左右,黃金首先在古埃及冶煉。 三十個世紀後,第一枚金幣在土耳其西部的一個古老王國被擊中,此後一直被強大的王國用作實物貨幣。

在現代時代,黃金已經從有形貨幣發展為貨幣儲備。 1819年,英國將貨幣與黃金掛鉤,正式採用了有史以來的第一個黃金標準。 到1900年,除中國外,大多數國家都採用了黃金標準。 但是,第一次世界大戰開始時,金本位制最終消失了,因為許多國家需要印鈔來支付戰爭費用。

今天,黃金在我們的生活中用於多種目的,例如造幣,珠寶,電子和牙科治療。 但是,貨幣政策和金融需求的影響可能會對金價產生更大的影響。

2.哪些因素會影響金價?

從理論上講,有很多基本,宏觀和情感因素都會影響黃金價格。 從基本面看,中央銀行,珠寶購買者和ETF對實物黃金有需求,而在宏觀領域,則存在通貨膨脹,利率,貨幣供應和美元實力。 此外,一些交易者會追蹤CFTC的淨頭寸數據,以評估投機者的情緒。

現實世界中的數據科學, 如何對黃金價格建模

> How can each factor theoretically affect the gold price?

基本因素的影響是最容易理解的。 政府和人們購買的黃金越多,市場上的黃金就越少,價格應該會上升。

在宏觀領域,通貨膨脹率是衡量一籃子商品和服務價格上漲(下降)的量度。 如果通貨膨脹率上升,我們的午餐和黃金的價格也將上升。 相反,如果利率上升,作為投資工具的黃金相對於國庫券將失去吸引力。 就像巴菲特所說的那樣,黃金是不會產卵的母雞。

"如果您永久擁有一盎司的黃金,那麼最終您仍然擁有一盎司的黃金。" - 沃倫·巴菲特

最重要的因素之一是貨幣供應量,它衡量了一個經濟體中可用的總貨幣量。 讓我們舉兩個例子來解釋為什麼貨幣供應量的增加會增加金價。

· 想象一下,您和您的朋友的經濟狀況不佳,他們同意使用您的壟斷資金相互買賣黃金。 如果您開始在車庫裡打印壟斷資金並開始從朋友那裡購買所有黃金,相對於您的壟斷而言,黃金價格將攀升。 換句話說,如果美聯儲開始印製美元噸,那麼黃金相對於美元的價格就會攀升。

· 再次想象一下您和您的朋友使用美元進行交易的經濟狀況。 如果您打印錢並給所有人免費的錢,那麼商品和服務的價格就會上漲,因為免費的錢將用於購買額外的商品和服務。 貨幣供應量的增加最終與通貨膨脹率的上升相反,因此金價可以上漲。

最後但並非最不重要的一點是,美元的強勢可能會影響黃金和其他以美元計價的商品價格。 如果美元貶值,只要其他國家以美元報價,其他國家就可以購買更多美元,然後購買更多黃金,從而推高金價和其他商品。

3.我們如何模擬黃金價格?

為了對黃金價格建模,我們首先收集輸入數據並應用數據轉換。 利用轉換後的數據,我們使用線性迴歸模型來解釋預測變量與金價之間的關係。 為了驗證模型,進行了樣本外回測,將計算R²值來衡量模型的性能。

3.1數據收集

為了準備進行分析和模型開發,自1981年以來收集並整理了以下數據:

· XAUUSD:黃金現貨價格以美元計價。

· 美國CPI:該指數跟蹤城市消費者支付的商品和服務價格的變化(即通貨膨脹率)。

· 美國M2:貨幣供應量包括現金,支票存款和易於兌換的貨幣。

· 美國GDP:該指標用於衡量美國經濟產出的規模。

· 美元指數:跟蹤美元相對於一籃子外幣的價值的指數。

現實世界中的數據科學, 如何對黃金價格建模

> Input data and sources

數據的一項顯著挑戰是,這些因素是在不同的頻率下觀察到的。 為了對齊頻率,將這些值按四分之一分組,然後取平均值。

3.2。 數據轉換與特徵工程

3.2.1。 目標變量

該模型中的目標變量是針對通脹調整後的黃金現貨價格。 為了通過通脹調整黃金現貨價格,我們通過美國CPI縮小黃金現貨時間序列。 展望未來,這種經通脹調整的黃金時間序列將被稱為"黃金現貨價格","黃金價格"或" XAUUSD"。

3.2.2。 預測變量

此迴歸模型使用兩個預測變量:貨幣供給與GDP的比率(M2 / GDP)和美元指數。 儘管美元指數可以保持不變,但我們需要通過將美國M2除以美國GDP來得出比率。 貨幣供應量與GDP的比率優於貨幣供應量,因為它可以衡量經濟中過量貨幣供應量。

3.2.3。 日誌轉換

在兩次轉換之後,我們將對數轉換應用於目標變量和預測變量,因為所有值均為正值並顯示出高正偏度。 這將幫助任何線性模型更輕鬆地找到圖案。

現實世界中的數據科學, 如何對黃金價格建模

> Correlation matrix suggests a strong relationship between the predictors and the target variable.

使用轉換後的變量,我們繪製了一個相關矩陣,以瞭解金價和預測指標之間的線性關係。 如圖所示,黃金現貨價格與貨幣供應量與GDP的比率高度相關,而與美元指數卻存在一些負相關。

現實世界中的數據科學, 如何對黃金價格建模

> Gold Price vs. Money Supply to GDP Ratio: Positive Relationship

更重要的是,這兩個預測變量與-0.08的相關度量幾乎不相關。 這表明,即使美元指數的相關性小於貨幣供給與GDP比率的相關性,美元仍然可以使用,因為它可能會添加不重疊的信息。

現實世界中的數據科學, 如何對黃金價格建模

> Gold Price vs. Dollar Index: Negative Relationship

3.3。 模型訓練與回測表現

現在,使用預測變量和目標變量,我們使用兩個具有線性迴歸方程的預測變量來擬合黃金價格。

現實世界中的數據科學, 如何對黃金價格建模

> Gold price linear regression model

請注意,由於預測變量數量少且預測變量之間的相關性較小,因此添加L1和L2正則化參數以減少過度擬合不太可能在此模型中添加值。 無論如何,還可以訓練其他算法,包括隨機森林和XGBoost。

現實世界中的數據科學, 如何對黃金價格建模

> Out-of-sample backtest results show there is no need for complicated models.

為了評估該模型,通過使用100個季度的滑動窗口反覆訓練該模型並預測下一季度的平均黃金價格來進行樣本外回測。 最終,將預測值與實際值進行比較以計算出R²,該值約為92%。

R 2是確定係數,它表示模型可以解釋的總變化的百分比。 因此,這個簡單的模型可以解釋高達92%的黃金價格總波動。

現實世界中的數據科學, 如何對黃金價格建模

4.我們如何使用該模型?

使用此模型,我們可以通過將對貨幣供應量,GDP,美元實力和通貨膨脹率的看法轉化為對黃金的價格影響來預測黃金價格。

我認為,短期內和長期內,貨幣供應量與國內生產總值的比率將增加,因為各國政府將繼續印製貨幣以抵消全球封鎖和信貸市場擔憂的影響。

但是,美元匯率可能會因避險需求而有所走強。 當市場出現拋售時,對諸如美元之類的避險資產的需求增加,美元走強。

結合這些因素,我預計短期內金價將保持相當波動,因為這兩個預測指標可以相互抵消。 但是,從長遠來看,我相信期待已久的牛市行情將會重現。


附錄

TL; DR

在大流行和貨幣戰爭中,黃金可能是意外通脹,極端貨幣貶值和經濟增長緩慢的理想避險工具。 數據分析表明,金價主要受以下因素驅動:

· 通貨膨脹率

· 相對於經濟規模的貨幣供應

· 計價貨幣的優缺點

其他可能影響金價的基本和情感因素是:

· 利率

· 中央銀行需求

· 黃金ETF需求

· 珠寶需求

· CFTC職位

免責聲明

本文的唯一目的是通過表達作者的個人觀點來教育讀者。 內容僅反映作者在撰寫本文時的觀點,不構成任何財務建議,也不反映作者所屬組織的任何觀點。

源代碼

· Jupyter筆記本

資料來源

· https://fred.stlouisfed.org/

· https://www.investing.com/

· https://articles.royalmintbullion.com/a-history-of-gold/

· https://www.econlib.org/library/Enc/GoldStandard.html


私信譯者獲取源代碼

(本文翻譯自Alex Kim的文章《How to Model Gold Price》,參考:https://towardsdatascience.com/how-to-model-gold-price-940e809ac665)


分享到:


相關文章: