數據大盜:小米與拼多多的電商數據是如何被賣到華爾街的?

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

來源:阿爾法工場(ID:alpworks)

就在小米上市前夜,華爾街的一位華裔基金經理點開了一封未讀郵件,郵件寫道:

“想知道小米的銷售數據嗎?我們提供實時數據,按照品牌和產品分類。線上的數據是從天貓和京東獲取的;產品數據包括手機、掃地機器人等。而且,我們還提供小米和其他品牌廠商的對比。如果感興趣,請點擊回覆。”

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

神秘郵件瞬間激起了這位基金經理的興趣。

畢竟,華爾街玩的就是一場信息遊戲。在股票市場,誰能提前得知消息,誰就可以預先佈局,從而產生“阿爾法”(超額收益)。

正在疑惑這封郵件來自哪裡,他的目光正好掃到了署名處:Sandalwood。

登錄Sandalwood官網,這家公司的主業看起來像是投資諮詢。而事實上,Sandalwood是一家數據交易商。

01

“數據大盜”

今年以來,越來越多涉及中概股的投資者,開始聽說並談論起“數據大盜”這個神秘的存在。

狹義地說,所謂“數據大盜”,是指那些通過特定互聯網網絡技術手段,從電商公司的平臺上獲取相關上市公司銷售數據,繼而將這些數據“清洗”整理後,出售給機構投資者的“另類數據公司”。

在他們的工作流程中,主要分為這幾個步驟:收集數據,清洗數據,分析數據,銷售數據。

作為其中的典型代表之一,Sandalwood系由一位名為Tony的華裔創立於2015年,自稱是亞洲最大的上市公司數據公司之一。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

Sandalwood只是另類數據的玩家之一

Sandalwood的主要工作,除了主動爬取相關電商平臺的數據之外,還從多家原始數據公司買入原生數據或清洗好的數據,進行銷售。

不同於那些初級“數據大盜”,Sandalwood本身還是一個數據平臺,並號稱客戶可以通這個平臺訪問7個獨特的數據源。

Sandalwood 的客戶,一般是資本市場中的買方,也就是那些代表他人投資股票和債券的基金——他們是尋求超額回報最積極的參與者。

更詳細地說,Sandalwood 最看重的客戶,是美國對沖基金中的量化基金。他們多看重並使用數據來產生“阿爾法”。

眾所周知,華爾街對於“阿爾法”的追求從來沒有停下過腳步。在過去的150年中,“阿爾法”的來源平均每10-20年就要變化一次。

在20世紀50年代,最初的對沖基金發明了多頭/空頭股票策略。在20世紀80年代,數學和計算機比手持式計算器更具優勢。在21世紀初,阿爾法是高頻交易。

這些策略或工具一度讓那些能夠首先使用它們的人比其他人更有優勢。但隨著它們變得越來越普遍,它們的優勢消失了,投資者不得不尋找新的策略工具。

目前看來,在如今的數字經濟中,使用那些由海量數據掩蓋下的獨特的、金融市場以前不知道的信息內容,是“阿爾法”的下一個來源。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

客戶希望從數據中獲得優勢,這便對Sandalwood所代表的另類數據公司們提出了更高的要求。他們需要數據比現在使用的更快或更準確,或者它必須提供以前無法獲得的獨特見解。

Sandalwood們常見的數據採集手段,包括比如網絡爬蟲,信用卡跟蹤,電子郵件破解,地理位置軟件,衛星,主流APP應用等——這些我們會在下文逐一揭示。

但是為了區別於對手,所有“數據大盜”都必須拼命去尋找更快更準確的數據來源。為此,其中的部分從業者選擇了直接和電商平臺進行交易,直接獲取第一手的產品銷售數據。

有利潤的地方就會有交易。對於數據交易商而言,還有什麼從電商平臺獲取的直接數據更好呢;對於電商平臺而言,身坐在價值連城的海量電商數據之上,為什麼不變現呢?

有了第一手的領先數據,數據交易商便可以輕而易舉地打敗其他對手,也幫助對沖基金贏得了“阿爾法。

02

風險:內幕交易與隱私保護

對於這樣的好用的信息,對沖基金往往一擲千金,數據公司幾十萬美金的年費似乎不在話下。

摩根大通估計,投資管理行業對大數據的支出在20億-30億美元,而且這個數字的年增長率,在以每年兩位數的速度狂奔。

如此火爆的數字交易產業合法嗎?

之前,美國證券交易委員會(SEC)已成功起訴涉及數據公司的內幕交易案件。該案件涉及兩名數據分析師通過分析信用卡交易獲取重大非公開信息。

由於他們未經數據所有者同意而獲得訪問權,因內幕交易而被起訴,並被迫支付超過1800萬美元的罰款。

SEC曾指控美國第一資本投資國際集團(Capital One)僱傭的兩名數據分析師,在2013年11月至2015年1月期間,對至少170家上市公司有關的信用卡交易專有數據庫進行搜索。被告人Bonan Huang和Nan Huang使用這些數據,在上市公司財報發佈前利用期權交易股票。

內幕交易是指,知悉證券交易內幕信息的知情人和非法獲取內幕信息的人,利用內幕信息自己買賣證券、建議他人買賣證券,或者洩露內幕信息使他人利用該信息買賣證券,從中牟利或者避免損失的行為。

這其中涉及到幾個關鍵的概念,包括可以影響市場價值的重要信息(Materiality)、未公開(Dissemination)的以及信託責任(Fiduciary Duty)。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

數據交易產業鏈中的內幕交易風險在於,有相當體量的數據是能夠帶來優勢的,也就是產生出影響市場價值的信息。

問題在於,由於數據集需要購買,一些機構有渠道購買,但普通投資者則無法獲取該信息。

所以儘管理論上數據集是可以公開採集和購買的,但事實上並非如此。所以,在某些情況下,如果使用或出售某些數據,特別上市公司季報公佈前的銷售數據,將涉嫌構成內幕交易。

在美國,對內幕交易的定罪不僅要求證明信息是重要的和非公開的,還要證明違反了信託責任(Fiduciary Duty),也就是說信息是在未經所有者同意的情況下獲得的。

由於許多電話和信用卡公司在其合同中包含允許其出售信息的條款,因此該條件很少得到滿足。但是隨著數據的不斷增多,同意不充分的可能性增加,從而增加了違反受託人義務的風險。

在歐洲,雖然不需要這一條來證明內幕交易,但其他方面的標準更高。

除此之外,隱私則是一個更大的問題——難道你忘了當前仍令臉書(Facebook;NASDAQ:FB)焦頭爛額額那檔子事?

03

數據採集手段:從爬蟲到衛星

為了能夠得到買家的青睞,數據公司的採集數據的手段可謂無所不用其極,其獲取渠道至少包括:網絡爬蟲,信用卡跟蹤,電子郵件破解,地理位置軟件,衛星,主流APP應用……

【1】爬蟲數據

網絡爬蟲是一種常用的收集數據的手段,許多的原始數據採集公司,都在公共網站、社交媒體、在線社區、郵件插件上搜索可能有價值的信息。

例如從應用程序和用戶評論的下載,到航空公司和酒店通過票務網站接收預訂的信息。而通過社交媒體網站,則可以獲取有關消費者觀點和趨勢的提示。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

網絡爬蟲可以跟蹤很多東西,從雜貨到汽車銷售的價格趨勢。分析師可以通過抓取消費者網站上產品的評論,來評估新產品的推出和產品生命週期。

比如下圖所展示的一家叫做Thinknum的數據銷售公司,不僅提供多家在美上市公司的領先數據,還提供相關的投資分析服務:

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

包括特斯拉車的庫存數據,以及各社交網絡上和用戶的交互數據。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

以及剛剛在香港上市的小米的社交網站的數據。當然,這是免費版的界面,相信付費版中提供的內容會更加豐富。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

而這家名為Yipit Data的數據分析公司,不但覆蓋多家已經上市的中概股,就是連剛剛遞交招股說明書的拼多多的數據,它都有!

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

【2】信用卡追蹤數據

這裡面另一個重要的數據來源,便是對消費者信用卡的跟蹤。這些數據可以直接顯示消費者真實的身份信息,以及在哪些產品上花錢的信息。

雖然它只能描繪出局部的銷售趨勢,但結合其他數據集,它們可以為機構投資者提供非常重要的判斷依據。

於是,信用卡公司便成為了一座金礦。信用卡交易數據是最有價值的細分市場之一,是消費類公司收入的頭等指標。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

【3】數據廢氣(exhaust data)

數據廢氣指公司記錄保存的副產品數據。許多科技公司都產生了數據廢氣,作為其核心活動的副產品,例如銀行記錄,超市掃描儀數據或供應鏈數據。

這些數據廢氣是由一些可存儲的選項產生的,操作和首選項,例如日誌文件,插件,臨時文件,甚至是為數字化完成的每個流程或事務生成的信息。

其中最有價值的莫過於接口廢氣。這是指網站從前使用的數據接口,後來不用了也沒有刪除。一些數據公司便可以介入這些接口,獲取上市公司的數據。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

【4】地理定位信息

智能手機配備了位置服務,允許我們使用地圖或天氣功能,但也讓移動運營商隨時瞭解我們的位置。

這些數據對於希望瞭解我們正在訪問的商店、酒店或餐館,以及尋找消費趨勢線索的機構投資者來說,非常的有價值。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

【5】傳感器及衛星數據

無論是來自衛星、智能手機、物聯網還是其他,傳感器產生的數據都是增長最快、價值越來越高的另類數據。傳感器產生的數據包括衛星圖像數據,行人步行和汽車交通,船舶位置。

傳感器數據通常是非結構化的,並且比個人或流程生成的數據流要大得多。衛星成像可能是最常見的例子,但地理位置數據越來越重要,因為它用於跟蹤零售店的步行流量。

傳感器數據將變得越來越重要,因為物聯網正在變得更加普及,尤其是將微處理器和網絡技術,嵌入個人和商業電子設備。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?

林林總總贅述了這麼多,想必你仍好奇開頭那位基金經理,對於數據大盜與“另類數據”最終作何處理。根據他的陳述,就在當晚,他已將郵件打印了出來,並放入了第二天會議的文件夾中。

版權聲明:部分文章推送時未能與原作者取得聯繫。若涉及版權問題,敬請原作者聯繫我們。聯繫方式:010-65983413。

数据大盗:小米与拼多多的电商数据是如何被卖到华尔街的?


分享到:


相關文章: