華為數據基礎設施“動起來”

華為數據基礎設施“動起來”

華為希望通過端到端的整合優化,在數據的全生命週期內,讓數據好用,實現每比特價值最大化、每比特成本最優化。這就是華為數據基礎設施的本質和價值所在。

01

啟動 · 加速

時間回溯到2019年5月15日,華為北京研究所,華為面向全球發佈人工智能原生數據庫GaussDB和高性能OceanStor分佈式存儲,同時旗幟鮮明地提出,將以“數據+智能”的理念重新定義數據基礎設施。

時間來到2019年9月19日,在華為全聯接2019大會上,華為Cloud & AI產品與服務總裁侯金龍清晰闡述了華為計算產業戰略,用一句話概括就是“一雲兩翼雙引擎,全面擁抱開放生態”。

此刻,2019年11月19日,華為全球數據基礎設施論壇正在深圳舉行。面向鯤鵬計算產業,侯金龍宣佈全面啟動數據基礎設施戰略。這也是繼基於“鯤鵬+昇騰”雙引擎全面啟航計算戰略後,華為從數據角度對計算戰略的再度深入詮釋。

從提出數據基礎設施的理念,到創新整合的數據基礎設施解決方案的推出,再到通過共建生態加速數據基礎設施的落地,2019年可以稱為華為的數據基礎設施年。

在數字經濟時代,數字產業化、產業數字化加速推動實體經濟與數字經濟的融合,數據成為關鍵生產要素。數據驅動體驗、數據驅動決策、數據驅動流程,數據成為一切的核心。數據是新的生產資料,算力是新的生產力,而5G、AI和雲則是新的生產工具,這三者的共同作用,將有力地推動數字經濟的發展。

在這樣的大背景下,華為致力於打造“一雲兩翼雙引擎”的產業佈局,構築開放的產業生態,讓AI與數據基礎設施深度融合,讓“智能+數據”全面普惠,使能不同區域與國家、不同行業與實體更好實現可持續發展。

02

數據基礎設施原來是這樣的

今天,越來越多的企業認識到,數據基礎設施是數字經濟成功的關鍵。正是數據“存不下、流不動、用不好”等問題促成了各行業積極構建新型數據基礎設施,加速實現數據價值變現。

在本次全球數據基礎設施論壇上,中國信通院與華為聯合發佈了《數據基礎設施白皮書2019》。白皮書對數據基礎設施的定義、數字應用的現狀、構建數據基礎設施的挑戰以及未來發展趨勢等進行了詳細闡述。

華為數據基礎設施“動起來”

基於“鯤鵬+昇騰”雙引擎的強大算力,華為持續圍繞數據構建計算、存儲、智能化能力,加強研發投入和技術創新。華為數據基礎設施包括數據存儲、數據處理、數據管理系統、數據虛擬化引擎等,它包含以下三大特徵:

融合:基於在存儲、數據庫、大數據等技術領域的突破,打破“存儲內部系統牆”、“數據庫與存儲鏈路牆”、“大數據與存儲配置牆”、“數據庫與大數據協同牆”四堵牆。這四堵牆的打破,讓數據融合更徹底,幫助客戶實現TCO降低30%以上、據訪問和處理性能提升兩倍、分析效率提升100%。

智能:基於AI芯片、存儲和華為雲的三層架構,通過雲上雲下結合,雲上訓練和雲下推理,讓系統越用越快、越用越省。

開放:針對找數難、取數難、用數難的問題,推出數據虛擬化引擎HetuEngine,屏蔽數據類型差異、地域差異、語法差異,讓數據治理、使用簡單。

華為智能數據與存儲領域總裁周躍峰指出,華為提供融合、智能、開放的數據基礎設施,支持交易型、數據湖、邊緣計算等不同場景,讓客戶和合作夥伴可以像使用數據庫一樣使用大數據,更簡單、高效地從數據中獲取價值。

業務與數據的多樣性,以及所有場景、所有數據類型的處理都需要多樣化且充沛的算力。只有融合的數據基礎設施才能滿足多樣化的應用需求。基於在存儲、數據庫、大數據等領域的技術創新與突破,華為致力於打破數據基礎設施內外存在的各種壁壘,讓數據融合得更徹底。比如,通過打破存儲內部壁壘,採用一套架構實現生產、分析、備份、容災、歸檔的統一管理、數據平滑流動,從而減少副本冗餘,降低30%以上的TCO ;再比如,通過打破存儲、數據庫與大數據之間的壁壘,採用存算協同、算子下移、融合分析等技術,可以實現數據的零搬遷,分析效率提升100%。

在“智能+”時代,計算將無處不在,智能也將無處不在。以數據為核心的基礎設施本身必須具有足夠強大的智能化功能,同時還要支持智能化的數據應用。華為創新地提出數據基礎設施三層AI協同管理架構,通過雲上雲下結合,進行大規模的雲上模型訓練和雲下推理。比如,依託昇騰處理器的AI能力,自動學習和識別IO流,提升Cache預取命中率,系統整體性能提升20%;再比如,依託鯤鵬處理器的多核算力,根據不同的數據類型,實時優化數據縮減算法,讓TCO降低25%。結合華為雲自身大規模運維運營經驗,當前可以實現提前14天預測硬盤故障,提前60天預測性能瓶頸,提前365天預測容量不足,其中30%的故障可以自我修復。從芯片到軟硬件系統再到雲,華為將智能化融入到數據基礎設施和雲服務中,融會貫通。

如今,開放、開源已經成了基礎架構領域最知名的標籤。華為面向企業級通用服務器架構平臺的操作系統EulerOS開源(開源名是openEuler),它能夠支持鯤鵬處理器和容器虛擬化技術,在系統可靠性、安全性和保障性方面具有很強的競爭力。華為自研的關係型數據庫GaussDB開源(開源名是openGauss),它首次將AI技術融入分佈式數據庫的全生命週期,實現自運維、自管理、自調優、故障自診斷和自愈,首創基於深度強化學習的自調優算法,調優性能比業界平均水平提升85%。在本次論壇上,華為再次發出開源強音:數據虛擬化引擎HetuEngine開源(開源名是河圖引擎,openHetu),以實現更快、更好的業務系統對接。

華為數據基礎設施“動起來”

華為數據虛擬化引擎HetuEngine向上可以接入海量應用,向下可以接入海量數據,通過一個標準、統一的接口,輕鬆解決海量業務應用與數據基礎設施對接的難題。數據虛擬化引擎屏蔽了數據基礎設施的複雜度,讓開發者可以像使用數據庫一樣使用大數據,將開發效率提升2~10倍。據瞭解,openHetu將於2020年6月上線。華為將開源內核,開發者可以基於開源代碼進行定製,包括數據源擴展、SQL執行策略等,實現應用快速對接,提升開發效率。

在雲原生、大數據、人工智能、5G等的影響下,企業的工作負載越來越複雜,而混合形態的數據基礎設施若想統一高效地管理和調度也絕非易事,更何況還要讓數據基礎設施與業務應用進行無縫對接,可謂難上加難。HetuEngine的使命就是讓數據基礎設施與業務應用的對接更加簡單,通過統一SQL接口、數據全域共享、數據零搬遷和完整的數據開放保護能力,打造“一個入口、一個目錄、一份數據、統一安全”的平臺,從而實現數據應用開發效率的提升、數據秒級獲取、數據實時處理,以及數據應用可信。

服務器操作系統開源、數據庫開源、數據虛擬化引擎開源,華為針對數據基礎設施的這套開源組合拳,目標明確,就是簡化數據基礎設施的構建與部署;路徑清晰,通過開源開放的方式,聯合數據基礎設施領域的各路合作伙伴,互惠共贏,共同推動數據基礎設施的創新與發展;措施有利,依靠鯤鵬智能數據產業聯盟旗下的數據庫、大數據、智能邊緣等幾個產業推進組,分工合作,由點及面,積小贏為大勝,從數據庫、大數據、智能邊緣等不同層面和領域不斷夯實數據基礎設施。

03

“數據+智能”是主脈絡

對於企業數字化轉型和新型數據基礎設施的打造,不同行業的用戶也有自己的獨特體驗和深刻洞察。

招商銀行與華為成立了聯合創新實驗室,主要在華為GaussDB數據庫,以及基於華為鯤鵬計算平臺打造容器平臺等方面進行深入合作。展望未來,招商銀行信息技術部總經理周天虹指出,整體軟件架構向雲轉型、微服務化、平臺化和開放化將是招商銀行實現數字化轉型的主攻方向。

廣東省機場管理集團致力於打造全流程智慧機場服務。從2014年開始,廣東省機場管理集團開始落地其數字化規劃,建立了包括服務雲、管理雲和生產雲在內的“三朵雲”,實現了跨單位、跨部門的數據共享。接下來,廣東省機場管理集團還將繼續加強數據深度融合,將其管理的現實世界中的6個機場變成數字世界中的“一個機場”。在數字化的過程中,廣東省機場管理集團與包括華為在內的多家廠商進行了合作。

深圳市打造數字政府,核心在政務,難點在資源共享。以前,業務和應用的“煙囪”、數據孤島導致了數據碎片化,也是造成行政效率低下的主要原因。今天,深圳市是政務信息共享國家示範市,它在解決數據共享問題時,從制度、平臺開發和促進應用三個方面入手,建立了深圳市政務大數據中心,以及兩地三中心容災系統,讓數據融合有藍圖所依、數據融合更具客觀性,實現了秒批秒辦、一站式創業創新等。

成立26年的金蝶公司,每天超過8000萬用戶在使用金蝶的產品和雲服務。2014年,金蝶從一家傳統軟件公司向雲轉型,當前金蝶雲蒼穹PaaS平臺、EAS Cloud等都運行在華為雲上。近幾年,藉助雲平臺,金蝶服務了大量各種規模的客戶。金蝶集團董事會主席兼CEO徐少春深有感觸,“數據+智能”是企業數字化轉型之道,而思維模式的轉變是最難的。把筆記本電腦、服務器、辦公室甚至ERP都砸了的徐少春,正帶領金蝶“化繭成蝶”,成為一家雲服務公司。

《數據基礎設施白皮書2019》指出,數據基礎設施應具備融合、協同、智能、安全、開放5大特徵,以幫助企業實現存儲智能化、管理簡單化和數據價值最大化。華為數據基礎設施主要包含數據存儲、數據處理、數據管理系統和數據虛擬化引擎等,其特徵可以歸納為六個字——“融合、智能、開放”。其實,這不僅僅適用於華為的數據基礎設施,也是整個數據基礎設施行業未來發展的主要方向。

我們必須清醒地認識到,企業向數據驅動型企業轉型的過程不會一蹴而就,隨著企業在每個階段對自身數據認知的不斷加深,對數據基礎設施的要求也會逐步增加。不斷成長的數據基礎設施,需要依靠開放的產業生態來推動,更需要在各種不同的場景實踐中不斷打磨和提升自己。

讓人備感興奮的是,數據基礎設施不僅僅是一幅藍圖,而是已經“動起來了”。


分享到:


相關文章: