“開源“的財富:鏈上數據是一座被忽視的金礦

幾乎所有數據在區塊鏈行業裡都是公開的,這些數據是“開源“的財富。金礦就擺在人們眼前,太多創業者卻“看不見“。

“開源“的財富:鏈上數據是一座被忽視的金礦

當前每一個加密風險投資基金都在追求一件事:投出下一個獨角獸(價值10億美元以上的公司)。像比特大陸這樣的挖礦硬件製造商(去年曾尋求港股IPO)和Coinbase這樣的交易所是首批躋身獨角獸俱樂部的成功企業。

從總體上看,目前加密領域的獨角獸可以分為兩大類:金融服務(Coinbase,Kraken,Circle,Binance)或挖礦硬件開發(Bitmain,Bitfury)。在這兩個行業中,有很多有前途的公司正在排隊向獨角獸努力,包括Bakkt和Innosilicon。

然而,本文主要關注一個不同的領域,而這個領域在未來也可能會有眾多獨角獸興起:區塊鏈數據產業


“開源“的財富:鏈上數據是一座被忽視的金礦


1

隱藏在公開數據背後的數據

在當前這個信息時代,投資公司需要數據來獲得競爭優勢。在區塊鏈世界中,幾乎所有數據都是公開的,網絡上發生的每筆交易都會永久記錄在公共賬本中,包括交易金額和涉及的地址。然而,從某種意義上說,數據仍然是“隱藏的”,因為這些存儲在區塊鏈中的數據難以處理以提取真正有用的信息。

正如TD research 合夥人和和以太坊2.0 Prysm客戶端的主要開發者Raul Jordan所言,用於比特幣、以太坊以及許多其他區塊鏈的數據模型(LevelDB)都是同樣為了交易完整性而優化的,並不是針對相關上的存儲或檢索。LevelDB不包含數據採集相關的模型,也不支持SQL查詢。這使得很難從這種數據格式中提取有價值的信息,此外,研究表明LevelDB容易出現數據損壞問題,這就讓處理區塊鏈數據變得難上加難。

區塊鏈數據被“隱藏”起來的一個明顯例子是Bitcoin Private(BTCP)在2018年3月Zclassic /Bitcoin合併分叉中偷偷增發了200萬BTCP(Bitcoin Private是Zcash的分叉鏈Zclassic和BTC合併分叉產生的,目的是為了引入零知識證明),直到2018年12月,當Coinmetrics公佈了BTCP發幣總數的分析時才注意到這一點。可能是因為BTCP並不是一個受歡迎的項目,所以這個事件花了大約9個月才被注意到。但是,這也表明即使是“公開的”區塊鏈數據也需要專門的處理來挖掘有意義的信息。

2

基本數據分析

2.1

源數據分析

處理和分析區塊鏈數據的複雜性為數據科學家和工程師創造了一個完美的機會,讓他們可以通過創立解決這些複雜問題的企業來進入區塊鏈行業,而準確的數據分析在加密行業中有著眾多的應用,下面我們來探討這樣的模式。

但在深入討論之前,先問一個簡單的問題:誰需要查詢區塊鏈數據?為什麼?

答案是每個人。

事實上,每個加密用戶都需要定期查詢區塊鏈數據。例如,當用戶需要知道交易是否已確認時,只需連接到區塊瀏覽器網站並使用地址或交易ID進行搜索。實際上,這背後的流程是這樣的:用戶“搜索”整個區塊鏈以獲得有關特定地址或交易的信息,區塊瀏覽器公司代表用戶執行了任務並交付了結果。在後臺,該公司實際上沒有真的去查詢區塊鏈,而是查詢了自己創建的根據區塊鏈數據派生的相關數據庫。

為了cover產生的成本,公司需要收入來源。例如,最受歡迎的以太坊區塊瀏覽器Etherscan通過廣告來產生收入,而幾乎所有其他的區塊鏈數據服務企業都使用類似的收入模式,無論是DApp數據,例如Dappradar;還是不同加密貨幣的價格及其市值信息,例如CoinMarketCap。但在許多情況下,這種收入模式容易受到負面影響,特別是在投放的廣告所宣傳的項目合法性方面。


“開源“的財富:鏈上數據是一座被忽視的金礦


2.2

合規性分析

區塊瀏覽器市場的總體市值已經有了百億級別的體量,因為它們所提供的2C服務是每一個區塊鏈的參與者都需要的,並且往後還會有很大的增長空間。

但對於一些2B的數據服務,僅僅是區塊瀏覽器級別的數據服務還不夠。投資者、基金和區塊鏈公司需要更加複雜的數據收集和分析,例如加密貨幣交易所。在美國和歐洲,交易所需要進行非常密集的數據分析來配合反洗錢法的規定以保證用戶不會將交易用於非法活動,例如將盜取的或者勒索的加密貨幣進行銷贓。

這些企業還有義務保證加密貨幣不會被用於支持非法的企業或活動。例如Chainalysis,Elliptic這樣的公司提供區塊鏈數據分析工具,而政府和交易所也正在使用這些工具來打擊非法使用加密貨幣的行為。大多數交易所更願意與專業數據分析提供商進行合作,而Coinbase卻決定通過收購備受爭議的數據分析公司Neutrino,讓企業本身就具備這樣的能力。

“開源“的財富:鏈上數據是一座被忽視的金礦


3

經濟型數據分析

3.1

經濟型數據有哪些指標?

區塊鏈數據的另一層作用在於分析經濟信號,而這正是投資者,基金以及研究機構作出投資決策時所需要的。這裡有三個非常重要的數據指標:交易所數據、鏈上數據、鏈下活動數據。


“開源“的財富:鏈上數據是一座被忽視的金礦


從經濟角度來看,交易所數據是最重要的但也是最難獲得的,因為作為交易所並不希望自己平臺的數據輕易被挖掘。至於原因,之前Bitwise的一份報告也很明顯:95%的交易所交易量是偽造的。

鏈下數據也同樣難以獲得,因為鏈下數據幾乎涵蓋了除了鏈上交易以外的一切信息,不僅繁雜而且難以量化。對於鏈下數據的收集分析目前僅僅來自於一些社區以及依靠捐贈存活的小型網站。如Coin Dance,它提供有關比特幣網絡及其分支上運行的節點的數量&客戶端分佈的歷史數據。Electric Capital 的開發者活動報告則是社區貢獻的一個很好的例子,這是一個依靠基金運行的範例。

3.2

經濟型數據的供應商

對於數據的精確以及標準化方面的需求催生了很多相關的數據企業,值得一提的是,目前的企業關注最多的還僅僅是交易所數據和鏈上數據,鏈下數據目前還沒有很明確的商業需求。

目前已經有數量眾多的數據分析企業,從今年從各個渠道獲取的數據質量就可以看出這一點。值得關注的平臺包括Kaiko,Coinmetrics和Messari。這些公司為數據生態系統做出了卓越貢獻,並且很有可能利用數據驅動投資來獲得更高額的收益。

Kaiko是在交易所數據方面的領先數據供應商之一。自2014年以來,他們一直從事彙總交易所數據的業務:從30多個交易所收集1000多個加密貨幣的數據。Kaiko提供每月訪問其交易所數據的許可證,或用於無限制的API調用的訂閱服務,每月所需的費用高達2.5萬歐元。有興趣的客戶還可以購買交易所中有關幣的歷史價格和交易體量的數據。他們還計劃將其產品擴展到包含OTC數據。最近,他們向Bitwise提供了數據,來協助Bitwise作出有關交易所交易量的調查報告,得出的結論是,交易所中有95%的交易量是偽造的。該數據和分析的主要成果之一是創建“Real 10”交易量指數,該指數彙總了10個交易所的交易量,這些交易所已經證明了自己可提供可靠的交易量信息。


“開源“的財富:鏈上數據是一座被忽視的金礦


Messari最初的願景是通過鼓勵加密項目披露有關項目及其創始人的重要信息,如相關開發者,早期投資者,ICO和Pre-ICO詳細信息,從而提高加密生態系統的透明度,並且其所披露的數據庫是公開和免費的。此外,Messari的OnChainFx為主要加密貨幣提供了經過改進的數據源,其中包括多種創新指標,例如“Y2050”市值(截止到2050年所能釋放的幣的總市值)和所有列出的加密貨幣的“Real 10”交易量。雖然Messari不對這些公開數據和服務收費,但他們會對經過數據分析所得出的結論以及他們開發的用於分析此數據的專用工具收費。除了多個鏈下活動數據外,Messari還計劃向其客戶提供幣歷史價格和交易量數據。

4

數據分析企業面臨的挑戰

雖然區塊鏈數據領域有很多優質公司,但這些公司需要解決的主要問題發掘這些數據真正的潛力。目前的數據分析可能會出現以下兩個問題:

1、交易數據可能會產生誤導,因為它不包括場外交易市場。許多OTC交易盤在協商價格後會通過直接轉賬進行交易。因為場外交易活動一般是非公開進行的,數據公司需要與多個場外交易商簽訂合同以獲取這些數據。

2、在許多情況下,源自鏈上區塊鏈數據的活動並不代表真實的經濟活動。例如,當一個主體在其控制下的不同錢包之間轉移幣時,比如將幣從交易所的熱錢包移動到冷錢包,反之亦然。要剔除此類事件中的數據,需要維護每個交易所使用的不同的錢包地址列表,這通常屬於數據分析公司的工作範圍。

這些公司離獨角獸企業有多接近?

由於其業務和客戶的性質,區塊鏈數據分析公司目前更可能接近實現數十億美元的估值。這些公司的客戶是政府,立法機構和交易所,必須遵守KYC規定;並且他們是資金充足且資金雄厚的主體,而這些主體又有利於數據分析企業發展。

數據分析企業的另一個優勢是進入門檻高,減少了競爭。早期參與區塊鏈數據分析領域的企業獲取了大量歷史信息,例如有關勒索軟件攻擊和法律條款的信息,這些信息是新進入者(或者可以說是傳統的軟件服務商)無法輕易獲得的。

交易所數據分析公司可以提供詳細的價格和交易信息,先入市場使他們更早地取得了和交易所的合作機會,從而彙總早期的交易所數據,這些數據是新的競爭對手無法獲得的。當然,作為後入者,如果能在鏈上數據的分析和提取有效信息方面有足夠的方法和技巧上的創新,或者可以提供更加深入的信息挖掘,也有機會佔據一席之地。

5

思考

對於區塊鏈這樣一個去中心化的世界,數據分析的供應商雖然作為一個重要的環節,但很可惜它是中心化的,有可能會因為利益而發佈一些有誤導性的數據分析結果。

為了避免這樣的問題,在數據分析上,有沒有可能也做到去中心化?能不能通過構建分散協議來以分散的方式為Web 3.0索引和查詢數據,並將分析結果共享?這是一個值得思考的新模式,或許會誕生一些新的項目。


分享到:


相關文章: