應用|博時基金的大數據平臺建設之道

點擊上方藍字關注“信息化時代”

应用|博时基金的大数据平台建设之道

2018年,中國公募基金行業迎來第二十年。20年前,中國第一家公募基金公司成立,開啟了中國財富管理的新格局。中國基金行業已成為國家金融體系的重要子行業,截至2018年1月底,公募基金資產管理規模達12.17萬億元,產品近5000只,基金資管機構128家,累計實現盈利超過2萬億元。博時基金管理有限公司(以下簡稱博時基金)成立於1998年7月13日,是國內首批成立的五家基金管理公司之一,也是目前我國資產管理規模最大的基金公司之一。

老思路撐不住新發展

应用|博时基金的大数据平台建设之道

博時基金信息技術部總經理 車宏原

車宏原介紹,基金公司傳統的業務邏輯就是通過直銷和代銷渠道募集資金,對資金進行投資管理,為投資者創造價值。業務線有兩條,一是募集資金,二是投資。募集資金主要靠渠道,傳統渠道是以銀行為主,現在互聯網第三方銷售、互聯網直銷渠道業務量也顯著增加。

博時基金支撐業務的核心繫統有三大類,一是募集資金端的註冊登記系統,負責投資者的開戶登記及清算;二是投資端的投資交易系統;三是估值系統,銜接募集資金端和投資端,給基金產品估值,讓投資者可以按估值來買基金的份額。

車宏原介紹,就整個金融行業而言,基金公司的體量相對於銀行、證券都比較小,早期的系統建設採用的是快速見效的模式。具體到數據平臺的建設,根據數據量特點和業務需求,博時基金早期主要是採用分散的數據集市的模式來建數據中心,如投研數據中心、銷售數據中心等。這種模式下,數據中心與業務應用是高度吻合的,但集市是分散的,數據不是集中的。其優點是起步容易、見效快、成本低;但缺點也很明顯,就是數據到一定規模,系統就出現瓶頸,性能不夠,可擴展性差。

近年來,在大資管、國際化和互聯網金融背景下,基金公司業務已經發生很大的變化,對IT的需求也發生了很大的變化。“行業初期只有傳統的公募基金,提供5×8小時的服務,業務和系統相對都非常簡單。但現在不一樣了,”車宏原介紹,一方面,有公募、專戶、年金、社保等多種形式的產品,有全球化投資,有股權、債權類投資子公司,以及財富管理、智能投顧等更豐富的服務形式。同時,互聯網金融讓投資者的日常生活與基金業務相關聯,需要支持7×24小時的服務和巨大的業務量。最近的熱點是金融科技,對雲計算、大數據、人工智能等新技術的應用提出了很高的要求。這些因素都讓博時基金的IT系統和計算需求越來越複雜,以數據集市模式來支撐如此的數據計算與分析需求,它越來越“力不從心”。

呼喚新一代數據平臺

數據分析是為業務服務的。在募集資金端的數據分析是為了進一步瞭解市場,做精準營銷和客戶服務;在投資端,數據分析是為了提高投資業績、提高投資回報水平;另外還有風險控制、產品規劃設計、基金運營、公司整體管理決策等方方面面都需要數據分析。

基金行業過去是從建設效率角度考慮,多采用應用驅動的分散的數據集市,企業級統一的數據平臺建設起步較晚。車宏原坦言,雖然已經普遍建立了市場營銷類、投研報表類、資訊類、管理類等數據分析型應用,但這些系統間相對獨立,既有數據重疊,也有數據缺失,不能形成共享整合的企業級數據平臺,無法為公司分析決策提供完整的信息。同時,各個部門分析需求各異,造成各種數據分析平臺的野蠻生長,進而導致洞察片面、產生分析能力瓶頸以及管理上的高複雜性。

總而言之,數據價值未得到充分應用,博時基金需建設行業領先的企業級新一代數據平臺。

另外一方面的背景是企業對數據價值的認識。越來越多的企業意識到數據是企業的核心資產,數據能驅動業務的發展、轉型、和變革。這些理念和認識,也是新一代數據平臺建設的驅動力,是新一代數據平臺建設需求所考慮的因素。

新一代數據平臺的建設目標是要綜合利用各種技術工具,激活數據資產,提升數據的價值、提升數據的驅動力、提升科技的支撐力。為滿足上述需求,新一代數據平臺需要建立數據服務和數據驅動兩大業務能力,建立數據管理、平臺計算、平臺服務三大平臺支撐能力。在考慮系統建設目標的同時,需要考慮系統建設的約束條件,以實現最合適的投資回報。換句話說,車宏原介紹,它需要全面整合內外部數據,解決數據在企業內充分交流、共享和融合問題,解決重複開發和數據不一致等問題,需要實現在功能、性能、數據質量、數據服務、價值挖掘等方面能力的提升,同時還要實現對主數據的管理能力,實現對非結構化數據、半結構化數據、大數據的分析處理能力。

具體而言,對數據平臺的建設需求,車宏原從幾個方面來梳理。在營銷和客服方面,需要支持渠道分析、銷售業績歸屬分析、客戶畫像、客戶行為分析、精準營銷、客戶收益分析、智能客服、智能投顧等功能;在產品管理方面支持產品設計、產品比較分析、市場評價、FOF、智能投顧等功能;在合規和風險方面,需要實現投資組合風險分析和預警、投資組合績效歸因分析、統一的監管報表等;在基金運營方面需要做到運營類查詢和報表、操作性風險警示;在經營管理方面要實現各項經營指標分析、管理駕駛艙、多維分析報表;在投研和量化方面要支撐宏觀策略研究、投資組合分析、投資輔助決策、智能投顧、量化模型訓練與驗證、大數據指數研究、輿情與市場熱度分析等。

MPP+ Hadoop搭平臺一期建設見成果

要做什麼定了,那怎麼做呢?經過綜合考量,博時基金決定用以MPP為主,MPP和Hadoop有效互補的技術架構來搭建統一的數據平臺,從而平衡成本、性能、可擴展性等多方面因素。

就像所有的系統選型一樣,博時基金數據平臺選型也是經過了對多家技術產品的論證對比。MPP有好多家供應商,Hadoop技術方案發展也很快,最終選擇了以Teradata的MPP為核心,做傳統的核心業務的支持,以Hadoop為輔助,做半結構化和非結構化數據的處理以及歷史數據的儲存和處理。

為什麼會選擇Teradata?“我們看重的是平臺、模型和方法論等方面的綜合能力,Teradata在這方面全球領先。”車宏原說,“建數據平臺是個非常大的工程,難度會很大、週期會很長,數據平臺建設偏離目標、週期拖得很長、成本失控,甚至項目失敗的案例並不少見。先進的模型、科學的方法論和成熟的經驗,可以為我們項目的成功提供保障。”

博時基金企業數據平臺的建設,採用了數據倉庫之父Bill Inmon提出的範式建模方法論,這種方法需要一次性整合企業數據、初期建設難度大,但是有利於對業務的長期支持、特別是對業務變化的支持。

範式建模方法對數據模型的要求非常高,在建設過程中,博時基金結合自身的經驗積累對Teradata的金融行業數據模型進行改進,形成適合基金行業的數據模型,填補了行業空白。

事實證明,博時基金的選擇是正確的。“我們僅用不到九個月就完成了第一期建設,完全實現項目計劃的要求,完成了對18個內部系統和6個外部數據源的整合,外部數據源包括國內的資訊系統和全球的資訊系統。數據庫表有1100多個,數據的字段有將近3萬個。這麼大的工作量,如果沒有一定的套路來做,很難在這麼短時間完成,還可能做著做著就亂了。是正確的決策讓我們順利地完成了數據整合。”

對於博時基金大數據平臺一期建設的成果,車宏原從以下幾個方面來總結:

第一,數據整合效果明顯。全部內部系統和外部數據源的數據入倉,為企業決策提供了完整的視圖。領導駕駛艙可以通過簡潔直觀的可視化展現,及時掌握運營狀況,銷售、投研等多數據源的整合,形象化凸顯的重點指標,同時可以實現交叉、分組、多維度數據鑽取。

第二,建立指標中心,解決了以前系統規劃的不足。過去,複雜指標數據都在軟件代碼中定義,而新的指標中心作為數據平臺一個清晰的數據層次,涵蓋了公司的主要業務範圍和相關數據,對內部和外部數據進行指標化處理,支持維度和指標的自定義,解決了過去架構下重複開發、數據不一致、統計口徑不一致、計算性能差等問題。

第三,形成了統一的報表中心。系統使用統一的查詢報表工具,建立了完善統一的數據權限管理;將分析類的數據查詢、數據報表進行統一管理,而日誌類、明細類、操作型或業務系統單獨使用的查詢報表仍保留在原系統,降低業務系統間的耦合。平臺進行整體的分層設計、維度設計和主題設計,提供常用的自助查詢和自助報表,以及少量自助多維分析。

第四,支持多種數據服務方式。除了報表類固定形式的數據查詢外,可以提供Excel插件、BI工具、軟件開發工具訪問等形式支持自助分析服務,滿足開發和業務部門自助取數、自助分析、深度開發的需要。

接下來,博時基金大數據平臺將繼續做那些事情?車宏原透露,最高優先級的工作是對傳統核心業務的數據支持。

除此以外,企業數據平臺還可以支持基於人工智能等技術的創新探索。可以開展很多這樣的課題,例如在更多的客戶屬性字段、更大數據量的處理能力、更高質量的客戶數據基礎上,採用人工智能技術進行客戶細分和客戶行為預測,從而進一步支持精準營銷、客戶服務和智能投顧等業務。

应用|博时基金的大数据平台建设之道

與您距離更近!

应用|博时基金的大数据平台建设之道

中國信息化週報(信息化時代)

官網:www.cio360.net


分享到:


相關文章: