資料庫市場迎來拐點了麼?這家公司想用開源方式重塑一套底層建築

數據庫市場迎來拐點了麼?這家公司想用開源方式重塑一套底層建築

摘要:數據市場的爆發,也給交付數據存儲和訪問帶來了前所未有的挑戰,需要用新的數據庫技術克服。

PingCAP CEO 劉奇的第一筆融資來的異常順利。

2015 年,程序員劉奇和兩位合夥人從豌豆莢辭職後成立 PingCAP 時,對 BP、公司估值等問題一竅不通。他們手裡只有一份關於解決底層關係型數據庫擴展的產品方案,理論啟發則來源於 Google 的分佈式關係型數據庫 F1 和 Spanner 的論文。

預料之外。第一次與經緯投資人見面的兩小時內,PingCAP 就拿到了天使輪啟動基金。再回憶起來,自稱當時不懂「商業」的劉奇還覺得幸運。

後來,「運氣」不再是支撐公司發展的主要動力。用了兩年時間,PingCAP 迭代到了 TiDB 1.0 的穩定版本並投入市場。但很快,在 2017 年完成 1500 萬美元 B 輪融資後,又在 2018 年 9 月拿到了復星和晨興資本領投的 C 輪 5000 萬美元融資。

投資人想下注的是賽道:根據 IDC 預測,到 2025 年全球數據將增長到 163 ZB,這個數字是 2016 年的 10 倍。數據市場的爆發,也給交付數據存儲和訪問帶來了前所未有的挑戰,需要用新的數據庫技術克服。而 PingCAP 的產品方向就是通過提供承載生產系統的分佈式事務性數據庫,適應這個時代對於數據庫的新需求。


數據庫市場迎來拐點了麼?這家公司想用開源方式重塑一套底層建築


這是被 Oracle、IBM 等巨頭沉痾業務的夾縫中生長出的新機會。基於分佈式架構的事務性數據庫被視為承載短時間內爆發的流量、彈性處理海量數據的最好解決方案。暫時,國內可能只有PingCAP 一家創業公司能夠提供這樣的能力。

需求和供應之間出現了巨大的空白,作為先行者的 PingCAP 在這片空白裡得到了飛速成長的機會。

「生逢其時」的 PingCAP

作為所有 IT 行業的「基礎設施」,數據庫的生意,一直是在跟隨著 IT 行業的業務需求而變化和升級著。

傳統的存儲方案裡,Oracle,微軟,IBM 和 SAP 等關係數據庫產品的增長和主導地位。後來隨著信息數據的存儲需求變化,非關係型產品,比如 NoSQL 的 MongoDB 和 Couchbase,並迎來了新的供應商和創新的激增。

但大數據時代的信息數據又一次實現了爆炸性的增長。幾年前,劉奇還在京東工作時,就感覺到傳統的存儲構架已經無法解決如此大數據量的存儲落地需求了。

這個判斷和 TiDB 後來走向市場時得到的驗證一樣。劉奇最熟悉、最先接觸的是一批互聯網行業的客戶。在國內互聯網行業還處於高速增長的階段裡,流量暴增有時甚至是「一夜之間」發生的事情。他拿轉轉和摩拜單車舉例:「兩家公司進入微信九宮格之後,流量有了十多倍的增長。因為流量漲的太快,在傳統架構裡,起碼需要花半年時間準備,否則就一定需要一個能夠有彈性能力、伸縮性的數據庫產品。」

一定程度上來說,PingCAP 抓住的就是幾個這樣的「時間點」。

PingCAP C 輪融資領投方復星新經濟產業集團董事總經理叢永罡表示:「TiDB 解決的,是分佈式計算中最後一個沒有被解決的問題。」在公有云的出現解決了計算分佈式和存儲分佈式的難題後,如何實現數據庫分佈式一直是行業面臨的難題。這涉及到被「拆分」存儲的數據如何與隨時發生變化的業務邏輯做匹配,並且適應彈性需求。「在做業務邏輯調整、要做數據遷移時,新業務和原有數據的匹配難度非常高,而且這種做法本身也不是那麼適合來做橫向的擴張。」

而 PingCAP 則在這方面實現了技術突破,用水平擴展的分佈式關係型數據庫產品打開了市場。這也是讓叢永罡感到興奮的地方:TiDB 的壁壘,很大程度上來自於底層技術。這也意味著作為搶先進入市場的先行者,TiDB 更有機會繼續迭代和升級自己的產品服務。

但是,在分佈式關係型數據庫領域,劉奇也並非沒有直接競爭對手。誕生在美國的 CockroachDB(蟑螂數據庫)也正在分佈式關係型數據庫領域拓展客戶。C 輪投資前,叢永罡考察對比過 CockroachDB 和 TiDB 的各項指標,但他發現,雖然起步時間更晚一年,但 TiDB 的發展速度卻更快。

劉奇耿直。他將 PingCAP 的「生逢其時」歸結於中國這個特殊市場帶來的紅利:

「在國外,某一領域的頭部公司出現後,一般不會有非常強勢的競爭者出現。但這種情況在中國快速發展的神話中是很常見的。慘烈的競爭就意味著企業需要更快的增長速度,這種情況下,也必須趕快把基礎設施能力提升上來。」

開源的社區,和廣闊的市場

PingCAP 進入的是一個龐大又增長迅猛的市場。據 IDC 統計, 整個數據庫市場已經超過 400 億美元。從收入上看,大部分市場還是由像 Oracle 和 Microsoft SQLServer 這樣的閉源商用數據庫所佔據著。

這意味著,PingCAP 需要在巨頭的籠罩下爭取市場。作為國內最先推出開源的新型分佈式關係型數據庫的公司,教育第一批用戶的任務也落在了劉奇的身上。


數據庫市場迎來拐點了麼?這家公司想用開源方式重塑一套底層建築

PingCAP CEO 、聯合創始人劉奇

這並不是一項簡單的工作。說服用戶將原有的數據庫換成一套全新的產品存在風險,劉奇明白,「誰願意拿自己線上的業務去冒險嘗試一個全新的數據庫呢? 況且還是一家創業公司的產品。」

PingCAP 的做法是讓 TiDB 能做到與 MySQL 數據庫的兼容。說服用戶先將 TiDB 作為背後數據同步,與前端數據庫相連,可以運行在實際生產系統。當按照這種方式運行一段時間、用戶認可 PingCAP 的產品後,會逐步替換掉 MySQL 數據庫,將 TiDB 作為前端數據庫。

劉奇記得,TiDB 還在內測時,公司的第一個客戶是遊戲公司蓋婭互娛。「當時對方的 MySQL 數據庫出現了問題,整個系統已經卡頓到無法使用。」由於需要實時監測廣告投放效果和反饋用戶需求,蓋婭互娛將 TiDB 作為後端數據集群,把前端 MySQL 的數據複製過來,進行實時查詢,才度過了那一段時間的難關。

一段時間的摸索後,對於初創公司 PingCAP 來說,獲取用戶已經不算是一件難以跨越的難題。這一方面是因為,PingCAP 創始團隊大多數來自豌豆莢、京東,BAT 等互聯網公司,經歷過數據指數級增長的時期,也更容易理解用戶對於數據庫產品強擴展性的需求。

另一方面,早在產品還在研發階段的那兩年裡,PingCAP 就在通過自己的開源社區與用戶保持著良好的溝通。至今 TiDB 項目在 GitHub 上共計已獲得 15000+ Star,項目集合了 200 多位來自全球的代碼貢獻者。

劉奇是開源理念的忠實擁躉,他堅定的認為,TiDB 不能「關起門來做自己的事」。在 TiDB 的開源社區裡,聚集了大量來自摩拜、知乎等互聯網公司的代碼貢獻者。「開源能讓用戶們儘早的瞭解 TiDB 的進展是怎樣的,理念是什麼,我們現在能夠跑的一部分代碼是怎麼用的,下一步迭代的方向又是什麼,如果用戶有興趣,完全可以自己寫代碼進來。」劉奇說,「想要快速得到響應的需求,在非開源的實踐裡面是得不到滿足的,很多需求也是用戶在自己的場景下才能真正瞭解是什麼,而開源的力量,就是能讓 TiDB 跟著用戶真正的場景需求去迭代。」

對於剛剛走向市場的 PingCAP 來說,開源社區不只早期為公司建立起和用戶的溝通渠道,也能為這個技術團隊無形中增強原本並不具備的「銷售推廣能力」。

劉奇承認,在這個 to B 的生意裡,和巨頭相比,起步時 「沒有任何資源」的高管團隊欠缺「銷售優勢」。但反過來看 PingCAP 將近三年的發展,幾乎沒有一個客戶是通過銷售關係帶來的,可早期的「剋制」反而帶來了更好的效果:TiDB 的產品自身價值成為了最重要的考核標準。

2017 年,應用在實際生產環境的用戶達到 200 家,最終產生十幾家付費客戶。PingCAP 也必須在未來加強自己的銷售體系,但劉奇有自己的標準,希望能找到理解用戶需求的「專家型銷售」。對於 PingCAP 這樣的創業公司來說,需要把用戶需求放在第一位,而不是維護關係。

C 輪融資後,技術研發和全球化生態系統建設是 PingCAP 的重點,劉奇也在謹慎的探索更多來自於金融、醫療、物流等傳統行業的客戶。這將是劉奇和團隊並不熟悉的領域,也意味著作為一家商業化公司的 PingCAP 需要花更多的力氣去理解客戶需求,維護客戶體系。

在開源的新型分佈式關係型數據庫領域,PingCAP 暫時還沒有一個強有力的競爭對手。

但這並不意味著劉奇沒有危機感。PingCAP 此時的優勢是跑出了一個絕對的「時間差」。開源很大的意義是在為這個新的領域建立標準,數據庫產品的精心打磨需要較長週期,即便是巨頭入場,從頭追趕,達到 TiDB 的成熟度依然需要時間。劉奇相信,最終用戶會對產品性能做出判斷,用腳投票,所以對 PingCAP 來說,它必須繼續維護、迭代產品,在這個「時間差」裡跑的更快。

叢永罡則覺得,這是個足夠廣闊和有想象力的市場,在數據庫行業的第三次變革來臨時,一定會有更多產品和公司出現,共同推進這個過程。但「To B 的市場並不是一個贏家通吃的市場。客戶永遠會根據自己的需要,去找最適合自己的產品。」



分享到:


相關文章: