方磊:2020年,“知識融合”將成為新的行業壁壘


方磊:2020年,“知識融合”將成為新的行業壁壘

本文由方磊撰寫並投遞數據猿參與評選。

2012年,數據科學家作為新興職業出現;2017年,Gartner首先為數據科學平臺給出定義;2019年,數據科學平臺在中國開始從小眾走向大眾。這種服務數據科學家及團隊的建模平臺工具在中國市場的表現,從晦澀到主流,從定義不明到自立山頭,僅用了一年時間,再一次體現了中國速度。

2020年,我們能看到數據科學平臺將迎來新一輪市場爆發。

市場利好+政策利好雙重助力,自動化決策需求成就數據科學平臺“高光時刻”

2019年仍然是數字經濟競爭激烈的一年,社會整體對數據價值的認知提升到新的階段。“數據科學家”,這個賦予數據更多價值的職業在任何國家都供不應求,在中國表現更甚。目前中國的數據科學家僅有2-3萬名,但市場上的人才缺口高達數百萬。教育部每年批准開設“數據科學與大數據技術專業”的高校越來越多,2015年首次批示僅3所,到2018年,共有488所高校獲批。數據科學人才正在加緊培育,但能夠高質量地填補人才缺口,還需要時間。

商業市場則走地更快,以數據、資源、需求等各方面都相對完備的金融行業為例,在人才有限的情況下已經獲得了高可用、可複製的數據科學實踐真知,從2019年8月央行下發的《金融科技(FinTech)發展規劃(2019-2021年)》可見一斑。這個針對金融科技的第一個頂層規劃中指出,要運用數據科學的相關技術(機器學習、數據洞察、數據挖掘、建模分析、算法模型等)解決各類金融場景難題。人才不夠,工具來湊,這也是近年來數據科學平臺在金融行業被成功運用的利好結果。

權威的第三方機構眼光就更加客觀和長遠,在今年8月和10月份,IDC和Gartner分別針對數據科學平臺在中國及亞太市場的表現相繼發佈研報;在相關大數據產業地圖中,數據科學平臺也開始作為獨立賽道進入公眾視野,九章雲極的DataCanvas數據科學平臺均有幸入圍。

一項技術得以獲得教育、政策、市場等多方面的綜合肯定和支持,背後一定具備強大的需求驅動。目前,市場上對數據分析的需求上升到了“自動化決策”,如果說用圖表展示已有數據的BI是數據分析1.0,那麼預測未來、可以自動做出決策的AI就是數據分析2.0。

數據科學平臺就是實現數據分析2.0的載體,數據科學的核心能力就是機器學習的能力、實時的能力、企業AI落地的能力,通過一個個數據模型,讓企業龐雜分散的數據變成高價值的決策,能夠真正地指導企業運營和業務決策。這正是當今企業數字化轉型、AI落地亟需的能力。

2019年,數據科學平臺在大數據行業中成功自立山頭,這是數據科學平臺在行業地位中的第一個“高光時刻”。

數據科學精細化發展,自動化成為時代寵兒

從國際視野來看,近年來數據科學受關注熱度有增無減,並趨向專業細分化。

Gartner每年都會預測次年的十大技術趨勢,從2016年開始,數據分析相關的技術開始出現在每年的趨勢報告中。在2017技術趨勢中,數據分析還沒有獨立出來,而是作為“數字技術平臺”這個技術的一部分,2018技術趨勢中出現了“智能應用與分析”,2019技術趨勢中出現了“增強分析”,剛剛發佈的2020技術趨勢進一步把數據分析細化了,叫做“超自動化”——指的是多種用於交付工作成果的機器學習(ML)、軟件工具包以及自動化工具的總和。

九章雲極一直超前把握和實踐技術的發展趨勢,DataCanvas數據科學平臺就是將數據建模的各個環節自動化的強大工具,並部署到企業業務中,從而實現企業“自動化決策”的需求。

具體到實際操作中,數據科學平臺的使用者還是數據科學家們,但隨著建模壁壘一再降低,尤其是藉助自動機器學習實現的自動建模出現,數據科學家的邊界變大、變模糊了。除了使用編碼建模的專業數據科學家,使用拖拽式建模的IT工程師和使用自動建模的業務人員也被統稱為平民數據科學家。

此外,得益於企業自動化決策需求的不斷推進,數據科學平臺工具的自動化功能將會愈加先進和完善,在未來甚至可以成為一種更低門檻、可廣泛培訓的軟件技能。

技術壁壘逐漸弱化,“知識融合”將成行業新壁壘

經過2019年的實踐,我們發現頭部企業對技術開放和技術傳承的要求也越來越高。擁有更多高端技術人員和更強技術實力的頭部公司,將自有的技術能力、模型資產轉化為企業軟資產的同時,也在思考如何將軟實力更好地管理和傳承下去。人員和團隊更替、各部門間協同難的情況都可能會產生技術能力的遺失和斷層。

其次,從市場反饋來看,頭部客戶同時也更青睞開源、開放的平臺架構,通過在開放平臺上進行自主建設,來降低鎖定供應商的可能性和對供應商的依賴程度,這也是市面上“白盒”算法、開源框架備受歡迎的原因之一。

更低的技術門檻、更開放的平臺架構,同時意味著更低的壁壘。當一個壁壘降低到一定程度,就不再是主要矛盾,屆時新的矛盾會出現,新的壁壘也就應激產生。

落到數據科學平臺行業來說,我們預測在2020年,“知識融合”將作為新的行業壁壘。

數據科學的發展本身就是由市場需求推動形成的,其核心目的就是提供更高的商業價值,也就是說,BI圖表展示、AI分析、自動化決策等等都是需求升級的產物。我們能看到,下一階段的升級將會是利用數據指導業務、指導企業運營的需求。

這就需要更多非數據、跨行業、多學科交叉的“知識”與技術相結合,最終被運用到業務場景中提升業務價值。讓知識與技術相結合的載體,實現的途徑之一依然是“人”,並且是即懂業務又懂技術複合型人才;途徑之二,還是工具。九章雲極的數據科學家們已經致力於此,建立“四庫”,這是業內首個關於“知識融合”解決方案,我們相信它能夠直擊企業下一階段痛點。

當然,“知識融合”問題也已受到各方機構關注,在央行下發的金融科技發展規劃中多次提及多學科交叉融合、造就即懂金融又懂科技的專業人才;國家雙創示範基地和大型企業在各類實驗項目和業務中,也正在實踐細分業務的知識融合。“知識融合”難題的解決,將成為數據科學賦能商業價值的新高光。

深耕耘+廣播種,數據科學平臺增量市場可觀

數據科學平臺在2019年的飛速發展可以從深度和廣度兩方面來概括。

金融行業作為數據資源最完備、技術實踐最領先的行業,仍是數據科學平臺的主要陣地。銀行、保險、基金、證券等各大領域本身涉及萬千業務場景,隨著Bank 4.0時代的到來,隨用戶需求調整業務成為金融行業未來發展的主流方向,這將對數據預測分析提出更多變、更智能的要求,數據科學平臺在金融行業的發展依然大有可期。

同時,以金融行業為典範,中國各行各業的數據生態建設也正在體現中國速度。政府、醫療、交通、IoT、航空、汽車、地產、零售……這些行業在數據積累的同時,企業數字化轉型、業務數字化運營等需求也從金融行業延伸過來,建設自有的數據科學家團隊的企業不在少數,知識融合更將加速其AI落地。

隨著各行各業的深耕廣播,數據科學平臺在中國市場的年增速已經達到70%-80%,未來幾年,數據科學平臺的市場容量將持續成倍增長、更加可觀。

對於九章雲極來說,從成立之處就已明確服務數據科學家的核心定位,“模型”就是我們的邊界。2020年,市場上新一輪數據科學平臺需求將會爆發,如何讓“四庫”更好解決知識融合問題、如何讓模型實現更多業務價值,是我們下一年發力的重點,腳踏實地、把聚焦的事情做到極致,依然是九章雲極的目標。我們相信,2020年也將是數據科學平臺又一個收穫之年。

方磊博士,九章雲極聯合創始人兼CEO,原微軟必應(Bing)搜索部門數據科學家,並作為早期團隊成員參與開發微軟雲計算平臺:Windows Azure。擁有近二十年大數據分析管理經驗,是大數據、機器學習前沿技術掌舵者。在分佈式系統、設計驗證、算法等領域發表論文16餘篇,引用超過400次。在大數據、人工智能、數據科學等領域中多次受聘為智庫專家、理事、常務理事等職位。


分享到:


相關文章: