01.20 它用分佈式數據庫替代Oracle、SAS,讓銀行告別西方軟件“霸凌”

它用分佈式數據庫替代Oracle、SAS,讓銀行告別西方軟件“霸凌”

WPS成功上市代表了信息化企業軟件國產化的趨勢。在雷濤看來,WPS不是簡單複製後替代Windows office,而是找到了下一代產品需求。

以往無論是運營商還是銀行核心系統,大架構都壟斷在西方的 IOE(IBM、Oracle、EMC)這三座大山裡。直到2008年阿里提出去“IOE”運動,開始助推信息化軟件國產化浪潮。

天雲數據就是其中最早一批入場者。2010年為了建立中國完整的雲計算產業鏈,中國寬帶之父田溯寧投資建設雲基地,天雲數據便由此孵化,初備雛形。

2015年,雷濤帶領創始團隊們正式成立天雲數據,率先切入金融領域。天雲提供了國內領先的國產HTAP數據庫Hubble,完成了“去IOE”中最困難的部分,替代金融A類核心系統慣用的西方IOE架構,在銀行的聯機事務中解決A類核心系統減負問題。此外,為了降低AI使用門檻,天雲數據還推出AI PaaS平臺MaximAI,逐步將數據價值逐漸擴展到能源、醫藥、軍事等其它行業。

目前天雲數據有70多家行業內大企業客戶,單筆合同200-500萬,純軟件年營收過億。

融資方面,天雲數據2018年曾獲得曦域資本、華映資本B輪1億人民幣投資。

從大數據平臺轉向AI基礎平臺

作為行業老兵,雷濤在北美跨國公司有20多年的技術管理經驗, 2005年便入席SNIA存儲工業協會中國區技術委員會聯合主席,CCF中國計算機學會大數據專委會委員。

2011年在雲基地時期,雷濤和創始團隊通過BDP大數據平臺負責了眾多運營商業務,如聯通的數據魔方、移動總部、南方基地等,2015年天雲數據正式獨立後,雷濤為了避免同業競爭,選擇先聚焦在金融領域。

“天雲數據的目標是替代 Oracle 和 SAS ”。雲基地時期的積累讓天雲數據一開始就有高起點,首單就接下了光大銀行的核心繫統——OLTP線交易系統。比如銀行能在全國所有營業廳實時實現OOTD交易,實時查詢存錢取錢數額,整個環節涉及的技術都是天雲數據早期對Oracle的一些替代。

但之後在多次的項目操作過程中雷濤發現,在幾百萬條交易規格的強一致性下,數據的移動性、計算框架的變化、聯機事務同時要做大規模並行計算,這對計算場景的通用性、即時性和全量數據要求極高,傳統 Oracle架構根本無法適應。

“在Oracle架構之上,還需要升級滿足新需求”。

於是天雲數據自主研發HTAP國產分佈式數據庫Hubble。與傳統 IT 架構處理失誤需要聯機分析和分開處理不同,HTAP 數據庫能夠在一份數據上同時支撐業務系統運行並做 OLAP 場景,避免在線與離線數據庫之間大量的數據交互,為系統減負。

它用分佈式數據庫替代Oracle、SAS,讓銀行告別西方軟件“霸凌”

HTAP國產分佈式數據庫Hubble替代了Oracle一體機,核心表2000餘張80T左右、400億條交易數據、提供56只服務應用交易、滿足500個用戶併發、500ms交易服務響應、每天在線交易量超200萬、佔整個銀行核心交易量的10%,讓銀行面向櫃面系統可提供7*8小時A類實時核心交易,面向手機網銀系統可提供7*24小時A類實時核心交易。

從集中式Oracle切換到分佈式HTAP,也解決了數據庫擴展性的問題。比如天雲數據讓光大銀行解決了歷史數據查詢問題,以往歷史查詢只能查到2年前,但在分佈式技術上線後,可以查詢15年前所有交易數據,同時讓銀行櫃面系統以及手機APP可以無數人同時查詢。

而在BI逐步轉向AI的過程中,複雜的商業流程經算法重構。過去要把數據拿到SAS平臺先分析,一層一層地把數據提出來搭建。但現在通過分佈式技術,流程趨於扁平化,可以實現毫秒級的服務響應。

專注大企業客戶

天雲數據一開始就撬動的是行業頭部資源。目前天雲數據有光大銀行、興業銀行、中信銀行、中泰證券、中國石油、國家統計局等70餘家行業內大企業客戶,分佈在金融、能源、醫藥、政府軍事等領域,單筆合同級別超百萬

針對每個垂直行業,天雲數據都會成立一個子公司來專注賽道。目前天雲數據有160人,技術人員超六成。

在雷濤看來,如果一年600個項目,全是5萬、15萬等碎片化的訂單,公司總是重複滿足初級客戶的簡單需求,技術很難沉澱和深入。“在當下成長階段,打造產品需要在用戶想要什麼和你想做什麼中找到平衡”。

對於雷濤而言,專注頭部大B發展有兩大發展潛力。一方面,大B擁有機器學習的普遍能力和實驗室,更容易接受新產品。另一方面,天雲數據交付產品和交付服務的同時也在轉移大B客戶的數據價值。

“AI本身是一個知識生產過程,它能把大型企業規則、流程的經驗價值快速地抽樣出來進行復制,賦能行業內其它客戶甚至類似的其它行業。”

但在頭部客戶更定製化、個性化的情況下,天雲數據是否失去了很強的複製能力?

雷濤解釋到,雖然每個企業要求不盡相同,但都在不大的池子裡找數據庫。企業從海量數據中對數據進行遷徙、清洗、去重,可以去找合適的AI方法讓它產生業務的價值,此過程具有通用性。

談到核心壁壘,雷濤認為天雲數據壁壘就是數據的複製價值。

壁壘的構建可分為兩個階段。第一個階段是前沿科技本身的壁壘,比的是效率和產品核心價值,誰能夠扎得深和更好的交付,誰就能拔得頭籌。而作為國內最早研發大數據和人工智能的團隊,天雲數據有一定的技術先發優勢。

第二個階段是推理端的服務。數據資源的價值需要通過機器學習進行提煉,形成知識,進而封裝成推理服務服務於行業。比如某保險公司20年長週期發生的重疾賠付定價上學習出來的特徵和內容能夠快速地移植到保險行業,而頭部大企業客戶給天雲數據帶來很優質的訓練數據庫。

未來AI將引爆萬億級大市場,但目前滲透率不到1%,這給各企業留有眾多機會和想象空間。但無論哪種圈地方式,最終比的是速度、服務的穩定性以及產品化的能力。


分享到:


相關文章: