如何獲取第一手金融數據

工欲善其事,必先利其器。作為一位金融工作者,要產出有質量的研究成果,

獲取第一手金融數據的能力是基本功

數據的檢索查詢(search)是研究(research)的基礎,這篇文章總結一下我在日常工作中的金融數據查詢的基本方法。

查詢金融數據的關鍵:一手信息,權威渠道。

01

金融研究常用哪些數據?

· 金融行情數據(股票、債券、黃金等資產價格指數);

· 宏觀經濟數據(GDP、CPI、利率等);

· 公司信息(上市/非上市);

· 專題統計數據,根據研究目標而定的數據需求,例如A股的散戶比例、各國的貨幣、財政政策等;

· 實時大數據,例如全球新冠疫情實時數據、全國人口遷移數據等;

其中宏觀數據、行情數據、公司信息等都是標準化的,重點是找對渠道,認準數據的口徑。從數據的頻率上來區分,宏觀經濟數據往往是月度、季度發佈的,稱為低頻數據;而金融行情數據是實時的,在交易日的每分每秒都更新,是高頻數據

專題統計數據的獲取沒有確定的方法,如果存在有可靠的專題統計,那麼萬事大吉,否則就需要統計整理的工作。

實時大數據則是最有時效性、很有含金量的部分。數據爬蟲的技術本身不算複雜,重點是拿到人無我有的數據,才能挖掘獨有的價值。此外,還有一些國外的金融數據,需要在外網權威渠道查詢。

02

如何獲取一手的金融數據?

先總結一下各種數據的基本渠道:

如何獲取第一手金融數據

1.

金融行情數據

金融行業數據,大多數炒股、買基金的朋友基本都會,沒有特別的技術。值得一提的是,2020年以來全球金融市場極度動盪,全球多種金融資產有必要放在一起看,包括美股、美債收益率、股指期貨、VIX恐慌指數、COMEX黃金等,才能對金融市場的變化有整體的感知。

如何獲取第一手金融數據

(示例:wind自選指標)

2.

宏觀經濟數據

香帥的金融江湖每月發佈的經濟數據簡析為例:

如何獲取第一手金融數據

(香帥的金融江湖:宏觀經濟數據解析)

宏觀經濟數據體現著國家經濟活動的冷熱,對經濟冷熱的感知直接影響我們投資的決策。要做好宏觀經濟數據的查詢、整理,要具備基本的宏觀經濟知識,準確理解經濟指標的意義。

查詢宏觀經濟數據,搞清楚數據的口徑非常重要。以利率指標為例——宏觀經濟中有多種利率指標:國債利率、存款基準利率、貸款基準利率、銀行間拆借利率、LPR利率等。

即使銀行間拆借利率拆借利率也有N個版本。因此每一個宏觀數據都要有非常明確的限定,討論和對比才有意義。

如何獲取第一手金融數據

(wind:各種口徑的銀行間同業拆借數據)

宏觀經濟數據一般每個月通過央行、統計局的網站發佈,此為最權威一手來源。一般wind(萬得)這樣的金融數據服務商會自動跟蹤,行業內默認以wind 數據為準

重要的官方網站:

· 國家統計局

· 央行統計調查司

· 中央結算公司


中央結算公司月度發佈新開戶投資者統計,是股市冷暖(韭菜進場)的溫度計。

如何獲取第一手金融數據

(中央結算公司:投資者統計)

3.

公司信息

上市公司的信息披露相對是全面,一般通過財經軟件都能查到基本信息。非上市公司的信息通過天眼查、wind全球企業數據庫等,基本可以查到全面的工商信息,尤其是股權控制信息。

例如,我們想查一下渾水做空報告中披露的瑞幸關聯公司——長盛興業的基本情況。

如何獲取第一手金融數據

(天眼查示例)

4.

專題數據

專題數據是一個非常泛的概念,完全根據研究需求而定。非標準化的數據查找,沒有一定之法,往往是一個順藤摸瓜、迭代的過程。基本的原則是——不要重複造輪子。你能想到的數據,往往行業內早有人做過了,找到可靠的彙總數據,是事半功倍的做法,形形色色的券商研報就是重要的線索。

▶ 示例1:券商營收結構

如果我們想研究中國券商行業的發展情況,就需要了解券商的營收構成。在wind中找到【券商行業透視】的專題板塊,即可直接查到歷年數據。

從數據可以直接的看出,整個券商行業從2018~2019,零售經紀業務的比例從31%下降到了27%,結合歷年的比例可以看出券商營收來源多元化的趨勢。

如何獲取第一手金融數據

屏幕剪輯的捕獲時間: 2020-04-13 10:00


(wind-券商行業透視)

▶ 示例2:A股投資者構成

想了解A股的投資者構成變化,就需要A股的散戶比例。通過券商研報搜索,關鍵詞"A股 散戶":

如何獲取第一手金融數據

(wind 研報平臺搜索)

從圖表可以看出來,A股的散戶投資者持倉佔比,從2014年至今是不斷下降的:從72.4%到52.5%

如何獲取第一手金融數據

(中金研報-A股投資者結構)

▶ 示例3:新冠疫情後各國的貨幣財政政策

想研究疫情後各國政府的刺激政策,就需要彙總各國的貨幣財政政策新聞。各國的政策是非標準的,動態的,沒有現成的數據庫可以查詢,在券商的宏觀週報中,往往會有政策彙總的專題。

以申萬宏源的《宏觀週報》為例,彙總了美國應對新冠疫情的2萬億財政刺激政策梳理。週報是很多券商的標配輸出,質量好的可以長期跟蹤,作為穩定的信息源。

如何獲取第一手金融數據

(申萬宏源宏觀研報)

5.

實時大數據

對於動態產生的數據,用大數據爬蟲的方法獲取是最及時有效的。例如,在新冠肺炎後,對應急影響最大的變量就是復工率。官方統計發佈的復工率往往是滯後的,研究機構往往會使用互聯網的移動人口數據來推測復工率,例如:

如何獲取第一手金融數據

(中信建投:復工率研究)

要注意的是,這樣的研究結果本質是二手的數據,要獲取一手數據,就要追溯到移動人口數據的源頭——百度遷徙數據(https://qianxi.baidu.com/)。

4月8日是武漢解禁的第一天,從百度遷徙大數據可以看出武漢市人口遷入、遷出的流向和規模。

如何獲取第一手金融數據

(百度遷徙:武漢)

網頁上看到的可視化數據,難以直接作為研究用的數據。要獲取表格化的數據,就需要採用Python爬蟲技術了。

如何編寫爬蟲呢?這依然是一個造輪子的問題,常用的數據源在網上往往有成熟的開源代碼。例如百度遷徙數據的爬蟲代碼,可以很容易搜索到。你需要的不是從頭開始寫代碼,而是消化改造、為我所用。

更專業的代碼,還可以從代碼託管網站github上查找,有編程基礎技能的同學應該都能搞定。例如新冠疫情的實時數據:

如何獲取第一手金融數據

(GitHub 新冠疫情實時數據代碼)

6.

外網數據

國外的金融事件、時政要聞,國內的二手信息往往不夠可靠,必須通過外網渠道核實。例如,我們要核實著名的KKR槓桿收購納貝斯克案的交易金額和時間。在國內某研報查到的數據是1989年、交易金額250億美元:

如何獲取第一手金融數據

(某中文研報數據)

通過外網原始報道(紐約時報:HISTORY OF THE RJR NABISCO TAKEOVER)核實的信息是:1988年11月30日,KKR宣稱以248.8億美元達成對納貝斯克的收購。可見中文資訊對國外事件報道的有效性還是不夠的。

如何獲取第一手金融數據

(紐約時報原始報道)

查詢外網數據,最重要的就是梯子工具,通過Google一般可以追溯到第一手的信息源,例如美聯儲官網、紐交所、納斯達克官網、世界銀行、IMF,以及其他權威媒體等。

03

總結

獲取第一手、權威的金融數據,是高質量研究的基礎。查詢數據的過程,也是不斷思考、分析、判斷的過程。數據來源清晰、嚴謹是文章報告可信度的根基。

在數據工作中,香帥老師給我的兩句指導:

1. No second tier material.

2. Check english and formal channel.

另外,專業的金融數據服務如wind是非常昂貴的,年費高達3~8萬。對於大多數人來說,沒有必要這麼專業,通過財經網站和央行等官網可以查到最常用的信息。牢記一手信息、權威渠道的原則。


轉載香帥的金融江湖


分享到:


相關文章: