衛星大數據怎麼玩? 這家公司用地理數據預測了金屬期貨走勢

衛星大數據怎麼玩? 這家公司用地理數據預測了金屬期貨走勢

在本篇文章中,我們採訪了RS Metrics公司的創始人兼CEO Tom Diamond,討論了目前的熱門話題——衛星圖像數據應用的崛起以及地理分析的前景,並研究了其商業價值以及投資價值。

RS Metrics是一家怎樣的公司?

RS Metrics CEO Tom:RS Metrics是一家面向企業和投資者提供衛星圖像數據和地理空間分析公司。利用先進的計算機視覺和機器學習,我們從各種基於位置的數據中提取富有洞察力的即用型數據,為金融服務,房地產,零售,工業,金屬,政府和學術研究決策提供預測分析,信號,警報和最終用戶應用程序。

在剛成立公司的時候,衛星圖像研究是怎樣的情景?

剛開始的時候,所有的東西幾乎都是100%人工製作的。早在2010年,大規模使用衛星圖像進行地理空間分析還處於早期階段,這意味著我們必須與衛星公司一起研究如何向我們交付批量訂單。空中客車(Airbus)和數字地球(DigitalGlobe)都從未這樣做過。谷歌Earth和RS Metrics是數字地球(DigitalGlobe)最大的衛星圖像消費者。不像今天,企業可以直接去DigitalGlobe,註冊他們的GBDX平臺,然後開始提取成批的圖像。在當時,我們必須自己建造它。

當時衛星運行的數量較少,所以大型零售連鎖店的樣本規模相對較小,但仍足以進行定量分析。現在有更多的衛星在運行,這使得樣本量更大,結果更細粒度和更準確。

在你的創業過程中,什麼時候最具挑戰性,迫使你重新思考業務?

在2015-16年衛星發射數量沒有實現的時候,我們面臨了業務上的轉變。雖然我們有大型量化公司和大客戶,但當手機和GPS數據開始出現,從衛星數據中吸引注意力時,我們面臨了激烈的競爭。當然,現在有更多的衛星和更多的數據可以用來測量零售交通趨勢,隱私法正在限制從手機/GPS獲取個人數據,所以事情變得更加現實,衛星數據再次成為零售業的焦點。但那時候,人們才開始意識到手機數據的顆粒度有多大。儘管它只捕獲了一個地點的一小部分客戶,但它每分鐘都在收集信息。而我們的數據只在每個地點每隔幾天收集一次。

所以我們真的需要更多的衛星圖像來增加樣本大小,使我們零售產品更強大。理想情況下,我們需要每天測量每家商店。但為了生存, 我們不得不增加其他不需要這種數字頻率的產品。

所以我們決定把更多的精力放在大宗商品上。MetalSignals是一個全球範圍的戶外金屬儲存調查,調查對象包括金屬冶煉廠、熔燬精礦的地方,以及港口和碼頭等儲存和運輸賤金屬、鋼鐵、煤炭和鐵礦石的地方,當然還有礦山本身。

我們仍在做零售業數據。但我們將在今年年底以其他方式重新推出它。隨著更多衛星的可用,我們現在能夠以客戶需要CRE的頻率和準確性,提供全球範圍內的零售和商業地產類數據。

MetalSignal是一款什麼樣的產品?

MetalSignals是一個平臺、一款應用也是一個數據流,可以提供以衛星影像為基礎的數據、趨勢以及根據每天、每週和每月度增長金屬精礦和成品儲存,提供全球鋁、銅、鋅、鋼產量的分析。這些精礦通常都是在幾百個人冶煉廠和儲存的,這些設施主要國家包塊中國、智利、俄羅斯、美國、澳大利亞等等。

MetalSignals不僅預測金屬本身的期貨價格和庫存,而且對100多種股票、貨幣和利率的價格也具有很強的預測能力。例如,銅通常被稱為“金屬之王”,與經濟關係密切。因此,我們的銅信號——在全球冶煉廠和倉庫測量銅的數據——預測了歐元、英鎊、澳元和日元的價格,5年期和10年期美國國債的利率以及諸如嘉能可(Glencore)、美國鋁業(Alcoa)、COPX等數百種股票和指數的表現。

許多MetalSignals客戶是對沖基金和宏觀/外匯公司,以及金屬行業的的交易商。但也有一些公司,你甚至不會想到它們會與金屬行業有關,如一些消費品公司正在與我們合作,為他們的鋁罐和其他產品包裝進行了鋁金屬的對沖。這樣做是因為他們可以觀察到世界上有多少鋁在生產,並預測價格,找出它們的去向。在RS Metrics,雖然我們仍然為許多金融機構提供服務,但我們也擁有廣泛的企業客戶。我們還與彭博企業數據(Bloomberg Enterprise Data)、CME數據胺(CME Datamine)和Quandl/納斯達克(Quandl/Nasdaq)建立了良好的分銷合作關係,為全球用戶提供訪問我們產品的渠道。

通過MetalSigal獲得的信號有多準確?

目前我們覆蓋了全球約500個地點,並且範圍還在不斷擴大。我們測量了這些地點的金屬成品、精礦和車輛的數量……比如阿布扎比的Al Taweelah冶煉廠或智利的Escondida。為了確保99%的準確率,我們會有人工控制工作流保證質量,他們可以糾正人工智能/機器學習中的錯誤。我們對預先測量的圖像進行檢查和糾正,然後為系統提供訓練和反饋。

我們從圖像中提取的數據聚合成一個指數,對倫敦金屬交易所(LME)、芝加哥商品交易所(CME)和上海期貨交易所(SHFE)等交易所的庫存和期貨價格具有高度預測性。大約70%到80%的定向準確預測價格和一個月,兩個月和三個月內的庫存變化。

這就有點像冰山。冰山的頂部露出水面,你能看到的只是冰山一角,這就是目前LME、CME、以及上海交易所等交易所的情況。這些都是有擔保的合同,但是其他一切都沒有人知道。我們可以觀察到從來沒有人報道過的俄羅斯一家冶煉廠的鋁,並且在上市前三個月觀察到在中國銅冶煉廠和存儲設施。

儘管這讓人震驚,但是我們數據的效果就是如此之好。

人工智能是如何賦能這項業務?會存在哪些侷限?

人工智能/機器學習的功能強大,但仍不成熟,對我們來說,它確實是一種達到目的的手段。它確實幫助我們完成了大部分工作,但它仍然需要人類的互動才能達到99%的準確率。

多年來,RS Metrics將計算機視覺和機器學習與嚴格的採樣技術相結合,來訓練底層的機器學習模型,這些模型為MetalSignal提供動力,並大規模生成高質量的數據。該平臺是我們獨有的,並擁有相關專利,其中包括一個縮放的QC工作流程,以產生高質量、有預測的和並且可供消費的信息。

但在大多數情況下,特別是冶煉廠,霧很大,地上有樹、水坑和雪。當我們看到中國,一些城市有霧霾,冶煉廠一開始就很髒,你真的必須讓人參與到工作流程中來。

隨著更多的衛星圖像數據可用,它將像消防水管一樣噴向我們,我們需要電腦來幫助規模化處理,同時它必須是準確的。

所以這對整個行業的每個人來說都是一個挑戰。你不會聽到很多人談論它,因為幾乎每個人,就像我說的,在這個空間裡都來自像素世界,他們的整個聲譽都建立於此。但事實上還有很長的路要走。但未來是非常光明的。

你所接觸的金融機構,它們是否能迅速接受這種形式的另類數據?

一張圖片所能傳達的信息勝過千言萬語,這是千真萬確的。地理空間分析是基於事實的,人們喜歡它。它把風險和“意見”帶出了情境。在很多情況下,僅僅看圖片就能回答某些問題,但在大多數情況下,所有客戶需要做的就是看數據和從圖片中發出的信號。圖片簡潔、易於理解和使用。我們並不是僅僅說“這是原始數據。接下來祝你好運!”這些數據可以通過易於使用的終端用戶應用程序、警報、信號和工具獲得,也可以作為客戶的日常數據提要,為客戶提供定量關注和功能。

以MetalSignal為例。客戶需要進行運行演示預測模型的所有內容都在一個壓縮文件中。我們提供白皮書,也提供了完整的代碼;我們從市場和衛星圖像中獲取信息,然後運行一個KNN,這是一個最近鄰的算法或預測模型,輸出所有金屬類型提前一個月到三個月的方向預測。RS指標通過結合人工智能和人類監督的最佳功能,目前達到70-90%的準確率。即使在今天,我們也是唯一一家能夠大規模生產這種數據的公司。

我們已經走了這麼遠,因為即使是擁有數據科學家的公司,他們也沒有太多的時間和資源來測試和解釋數據。這就是為什麼我們不只是製作數據,而是將贏利點和洞察力直接送到他們眼前。


分享到:


相關文章: