人工智能都這麼火了,底層基礎架構還有必要開源嗎?

開源是技術圈永不過時的話題,而作為目前最成功的開源項目,OpenStack在開源世界的成功有目共睹。

OpenStack的熱烈爭議。但上月底OpenStack主要領導者紅帽被IBM以340億美元的巨資收購案,毫無疑問給OpenStack的擁躉者加重了砝碼,也強勢宣佈了OpenStack在開源界不可動搖的地位。

此外,為了更加順應開源開放、共享、包容的精神,OpenStack基金會還將OpenStack的定位調整為“開放基礎設施”,並且在2018年將之前的OpenStack Days China更名為OpenInfra Days China——那麼,開放基礎設施到底是什麼?為何它會如此重要?在數字化、智能化轉型的時代,開放基礎設施究竟將發揮什麼樣的作用?能為用戶帶來什麼?

為了回答這樣的問題,CSDN有幸邀請到了開源界知名大咖,浪潮雲計算產品部副總經理劉曉欣、英特爾開源技術中心網絡與存儲高級研發經理、OpenStack基金會個人獨立董事王慶來到CSDN主編下午茶,把酒言歡,共話開放基礎設施!


人工智能都這麼火了,底層基礎架構還有必要開源嗎?


開放精神引領開放基礎設施發展


您對開放基礎設施怎麼看待,您覺得開放基礎設施為何那麼重要?

劉曉欣:現在越來越多的數據中心裡的整體技術採用了開放技術體系,其實我們能夠看到,從底層的技術硬件,比如OCP、ODCC這種開源組織生產的開放的硬件,到系統軟件,例如Linux操作系統,雲層面的OpenStack以及Kubernetes等一系列的技術都是開放、開源的技術。我們認為,未來在整個IT基礎設施領域,開源、開放的技術會越來越多的引導和推動著IT基礎設施的轉變,所以我們才會有開放基礎設施的這種稱呼。

在OpenStack領域,我們也看到,OpenStack Days China改成了OpenInfra Days China,在今年的柏林峰會上我們也聽到了OpenStack基金會也會將下一屆OpenStack峰會更名為OpenInfra峰會,而這種改變其實都是代表著OpenStack社區在積極擁抱整個開放基礎設施這麼一個方向。

王慶:OpenInfra確實是OpenStack基金會對於現在OpenStack戰略的調整。OpenInfra相比OpenStack來說,涉及的範圍會更廣,因為除了OpenStack之外,還有很多的開放的標準,開放的軟件,開放的設施。從OpenStack基金會角度來說,在很多新的領域,OpenStack已經不能解決所有的問題了,比方說邊緣計算,OpenStack就需要重新調整去迎合邊緣計算的需求。又比如說Kata Containers安全容器,OpenStack也想做。還有基礎設施的生命週期管理,OpenStack現在也不能解決這個問題。所以OpenStack基金會也是經過了一番慎重考慮,才在戰略上對於OpenStack本身做了一個新的調整。因此,明年在丹佛舉辦的OpenStack Summit才會更名為OpenInfra Summit。


開放基礎設施才是智能化轉型之路


既然基金會把OpenStack的方向定位在了開放基礎設施,那OpenStack社區的熱點有沒有什麼改變?

劉曉欣:我一直在關注整個OpenStack基礎趨勢的一些變化,其實在一年前,就有OpenStack基金會將會向OpenInfra轉變的種種跡象。我們看到社區中有很多新興的領域,比如容器、邊緣計算、StarlingX,又比如說Cyborg以及Cyborg如何與AI相融合,怎樣去做更安全的容器,這些其實都代表OpenStack社區在向開放基礎設施這樣一個大方向轉變的一些變動和調整。社區層面的變動也會使作為廠商的我們往此方向的思路上去調整,因為未來整個基礎設施肯定不會都是OpenStack,而可能會有更多的相關組件聯合在一起,即所謂的一體化解決方案,這應該是一個從傳統的基礎設施轉化成真正智能化的雲基礎設施的一個過程。

王慶:OpenStack社區的熱點一直在變,2010年到2012年熱點是公有云,2015年是私有云,2016年到2017年是NFV。現在從這次德國柏林OpenStack Summit上來看,熱點有兩個,一個是邊緣計算,另一個是人工智能,這實際上也就是當前數字化、智能化轉型趨勢的一種表現。


Rocky為開放基礎設施注入新活力


前不久OpenStack推出了它的Rocky版本,也就是R版本。那麼R版本有哪些方面的改進,它會給用戶帶來哪些益處?

劉曉欣:Rocky版本今年8月底就已經發布。Rocky版本修復了OpenStack上一個版本的很多問題,在這次OpenStack Summit上,提到在過去一年的時間裡面修復了7萬個Commit,累計7萬個Commit修改是很大的變動,因此,Rocky不論是在核心組件的穩定性,還有可靠性方面,都有較大的提升。但令我印象比較深刻的可能是裸機層面的管理,因為裸機與虛擬機、容器,在很長一段時間將是並存的一個狀態,所以OpenStack社區在裸機層面做了很多工作。Rocky版本在裸機的BIOS設置等方面做了相當多的改進,同時,Rocky也增加了對很多新興技術的兼容,包括人工智能、邊緣計算和容器等。從Rocky版本中可以看出OpenStack基金會打造“開放基礎設施”的決心以及想實現“讓世界運行在OpenStack之上”的目標。

王慶:從大的方面來講,Rocky減少了服務停機的時間,這是一個加強。比方說在Rocky版本中,Nova的停機時間減少了。第二,解決了Cross的問題,即Cross Cloud compatibility的兼容性問題。第三,對安全性的加強。從個人角度來說,我自己比較關注Nova、Cyborg,這裡要特別提一下Cyborg項目,Cyborg項目為GPU、FPGA、DPDK和SSD等加速器提供了生命週期管理。Cyborg在Rocky中引入了面向FPGA的新REST API,使得用戶可以動態改變FPGA設備上加載的功能。

浪潮雲海OS也即將支持Rocky版本,具體情況是怎樣的?

劉曉欣:雲海OS是浪潮的IaaS雲平臺解決方案,它的核心以OpenStack為基礎來構建,包含底層的虛擬化,上層的雲端管理。我們最近的工作一直聚焦在用Rocky版本來迭代我們的產品,目前預計在12月底或者1月初推出這個新版本。雲海OS上一個版本是基於OpenStack的Ocata版本,從Ocata到Rocky其實是跨越了幾個版本,這也是浪潮一直做私有云的思路,並不是每個版本都跟進社區的進展。所以雲海OS的Rocky版本,一方面可以得到穩定性、可靠性方面的提升,另一方面,我們也是嘗試將Cyborg項目對GPU的管理融合到產品管理中,從而希望我們的雲平臺未來能夠對AI平臺的應用有很好的支持。另外,對於剛才提到的容器,我們基於社區的MEC,MEX項目做了很多對接,使得OpenStack和Kubernetes能夠直接融合。同時,我們還把Kubernetes容器的管理嵌入到了OpenStack雲中,這樣不僅僅使得系統可以啟動Kubernetes的集群,容器和鏡像的操作也都可以在OpenStack中直接完成。此外,在裸機管控方面,我們打通了虛擬機和裸機網絡相關的驅動,增強了平臺的能力。

您對廠商們採用或者支持Openstack這個Rocky版本有什麼樣的看法?

王慶:實際上,相對來講,廠商還是比較保守,他們一般都是希望能夠有一個穩定的版本,因為穩定大於一切。廠商不會說一個OpenStack新版本出來以後馬上做升級,它會跳著升級版本,除非新版本確實有比較大的改進,就像浪潮所做的那樣。

劉曉欣:還有些廠商不會把整個產品都往Rocky上全部顛覆做更新,而是會挑選其中某些功能來支持,比如有的產品需要比較強大的裸機管理功能,可能對於其他項目不一定會做最新升級,但是會從Rocky中挑選 Ironic裡面新的功能加到自己的產品上去。


開放基礎設施是智能化轉型的基礎


這次雲海OS升級,還提供了對AI stack的支持,為什麼?

劉曉欣:浪潮雲海OS作為一個開放的基礎設施平臺,對於人工智能一直比較關注。因為浪潮一直在做AI相關的事情,例如AI的服務器,同時,我們也有一些這方面的積累。浪潮原來有一個稱作AI Station的平臺,其實是把AI服務器GPU化,用於上層的AI應用訓練,還有深度學習,它能夠支持AI應用自動化的在系統上運行。

隨著雲平臺與智能化道路的逐漸融合,我們認為在未來的環境裡面,AI的應用會越來越多,會有一個爆發式的增長,因此對於底層資源的管控,需要提供整體的數據中心的雲化一體化方案,可以把異構的資源能夠納入到一套平臺中,所以我們把AI Station的一些能力與雲海OpenStack進行了融合,發佈了InCloud AI-Stack這樣一個產品,其實是我們在智能整合道路上邁出的一步。

王慶:人工智能是一個系統工程。OpenStack能夠給AI應用提供一些基礎架構設施的服務,讓AI應用可以在OpenStack雲中運行。但這樣的話,就不僅僅是涉及到AI本身,可能還要涉及大數據、數據存儲等一系列問題。所以我覺得人工智能是需要很多技術來支撐的,例如,GPU、FPGA、邊緣計算、網絡等等,而這就不是單單隻依靠OpenStack就可以解決的,而是需要支持更多開放技術的Open infrastructure的支持。


開放基礎設施是大規模雲管理的利器


現在的雲的規模越來越大,多雲已經成為趨勢。那麼,在多雲管理方面用戶面臨怎樣的問題和挑戰呢?

劉曉欣:從多雲角度來看,不管是IDC還是Gartner的趨勢報告裡面都在強調多雲、混合雲。從浪潮實際的客戶上來看,浪潮接觸到一些雲化的客戶,比如說一些大的國企或者大型的企業用戶,他們確實存在多雲的情況,比如不同廠商的雲,又比如私有云和公有云。在這種情況下,這些企業的核心訴求就是一個更方便的統一管理、統一運維、統一視圖的開放基礎設施管理平臺。因此,浪潮在vForum 2018上發佈了基於浪潮InCloud Manager的多雲管理解決方案,提供多雲統一管理、異構虛擬化統一管理、跨雲資源調度和編排、多雲治理、統一監控和運維、統一成本分析和優化以及基於API構建跨雲應用等七大功能,實現了對多雲環境的統一管理與智能運維,幫助客戶更好的應對多雲時代挑戰。

王慶:多雲的問題,其實是一個老生常談的問題,也是一個歷史遺留問題。它產生的原因可能是用戶在早期採用不同廠商的解決方案,從而導致在後續上雲的過程中出現了多雲的問題。我個人理解,對於OpenStack中的多雲管理方案,主要的訴求,就是需要有統一的API,不管上層怎麼改,API和接口都要一致並符合,那麼,解決這個問題就會變得容易一些。

剛才談到雲的規模比較大時,會出現多雲的問題,其實還有另外一種情況,就是也會出現OpenStack大規模集群,對於OpenStack大規模集群的管理,應該怎麼解決呢?

劉曉欣:確實,現在客戶OpenStack集群越來越大,超過千臺的也是屢見不鮮,這其實是對OpenStack的一個很大的挑戰。浪潮今年上半年有一個客戶,它的OpenStack規模達到了1500臺,分兩地三個中心,其中一箇中心的規模達到了一千臺左右,我們的解決方案是,兩地三中心統一採用InCloud Manager跨雲管理平臺管理,中心節點採用OpenStack來解決,經過三、四個月的攻關,最終解決了這個問題。所以通過這樣一個項目,我們自己內部的團隊其實也得到了很多鍛鍊,因為OpenStack很多坑都是得蹚出來了。

王慶:就像劉總所說的那樣,以前500臺的OpenStack集群就算是很大規模了,2015年時,OpenStack社區裡能夠對外宣稱的最大規模的OpenStack集群就是歐洲核物理研究所CERN,好像是有兩三千臺的規模。但實際上,國內某運營商的規模在那時已經達到了一兩千臺。但不管是CERN,還是該運營商都沒有解決所有的問題。後來我們也是和運營商及其合作伙伴蹚過很多的坑,用Ironic進行大規模集群管理,後來OpenStack基金會也專門成立了工作組來討論大規模集群管理的問題。

後面大規模集群又分成了兩種,一種就是數據中心裡面的大規模,整個數據中心裡面有兩、三千臺機器,全國有數個數據中心分佈在不同的地點。另外一種是,中心節點非常少,但邊緣節點特別多的大規模。OpenStack基金會對這兩種大規模都將會長期跟蹤,與大家一起來共同解決大規模集群管理的問題。


融合並存是開放基礎設施的未來


您對OpenStack、開放基礎設施的未來趨勢有什麼看法?

王慶:業界有一種聲音,說OpenStack在走下坡路。但從我個人角度而言,我覺得OpenStack應該不叫走下坡路,反而是處於成熟穩定期。前幾年,是OpenStack的飛速發展期,現在它穩定了。有部分人說,虛機管理的問題完全都可以換成用容器來管理。個人認為,不管容器也好,虛機也好,甚至是裸機,它們三者將會是長期共存的。所以總結來說,OpenStack的成長已經進入穩定發展期,將來的趨勢是容器、虛機、裸機三分天下,相輔相成,誰都無法替代誰。

劉曉欣:與王總觀點相同,我認為是裸機,虛擬機、容器其實是長期並存的。現在容器的風頭確實是蓋過了OpenStack,對於一些新興的,或者說從零開始的用戶,他們可能可以朝著容器的思路和方向去走。但是很多傳統的,比如說使用原來軟件開發模式,有著各種行業應用軟件的用戶,這種改變的過程是很大的,而且有的可能是無法改變的。這也就是為什麼我覺得未來五年或者十年,裸機、虛擬機、容器都會長期共存的原因。同時,這也是OpenStack基金會今天不把自己侷限於一個虛擬機為主的平臺,而是重新轉向OpenInfra的主要原因。

PS:點擊https://bss.csdn.net/m/topic/inspur_os觀看直播回放,獲取更多精彩內容!


分享到:


相關文章: