浪潮集團彭震:OpenStack AI雲平台是雲+AI融合的一次探索與實踐

8月30日,浪潮集團副總裁彭震在2018浪潮技術與應用峰會(Inspur World 2018)上表示:“以雲計算、大數據、人工智能為代表的智慧計算,正加快驅動生產力躍升和商業模式變革,重塑社會運行結構和組織生態。在這一趨勢驅動下,計算力實際上已經成為社會經濟的核心生產力之一。為此,浪潮將持之以恆的發展融合架構IT基礎設施,此次OpenStack AI雲平臺的推出,是浪潮在雲+AI融合基礎架構上的一次探索與實踐。”

浪潮集團彭震:OpenStack AI雲平臺是雲+AI融合的一次探索與實踐

浪潮集團副總裁 彭震

據瞭解,浪潮此次重磅發佈的OpenStack AI雲平臺,實現了在OpenStack雲平臺上快速、輕鬆的構建AI開發能力。可幫助行業AI用戶快速便捷的構建CPU+GPU的彈性異構雲環境,並實現對異構計算資源池的動態調度與分配,支撐數據管理、模型訓練、模型部署等各類AI應用場景。通過對GPU虛擬機的支持,浪潮OpenStack AI雲平臺能夠以多租戶的形式,按需分配異構計算資源,從而實現AI敏捷開發。同時,多租戶任務排隊策略、資源分組優化策略、租戶資源配額集均衡策略以及GPU共享策略等精細化調度策略,也進一步提高了GPU資源的利用率。

浪潮集團彭震:OpenStack AI雲平臺是雲+AI融合的一次探索與實踐

浪潮OpenStack AI雲平臺架構

浪潮AI&HPC總經理劉軍也表示:“浪潮OpenStack AI雲平臺為用戶提供了面向未來的雲+AI融合基礎架構,使其在開源雲平臺上能夠簡單、快速構建易用、先進、完整的AI開發環境,賦能更多行業快速利用人工智能技術進行產品服務開發、精細化管理等,將有力推動人工智能技術的商業價值實現與社會變革。”

浪潮自主開發的AIStation在集成度上有顯著提升,極大的降低了AI開發難度並簡化操作。一方面,AIStation內置優化的Caffe-MPI、TensorFlow-OPT等深度學習分佈式框架,能夠有效提高模型訓練的擴展性,同時內置的高性能深度學習容器鏡像針對Xeon SkyLake + Tesla GPU + 25G Ethernet環境予以深度優化,可充分發揮GPU計算性能,平均訓練速度提高30%;另一方面,AIStation整合了訓練數據、模型文件、計算資源,可提供多機並行訓練服務和模型可視化工具,支持創建模型訓練工作流,通過界面化操作極致簡化AI開發人員工作流程,實現了秒速構建深度學習開發環境。

業內人士分析認為,隨著AI在社會生產生活各環節的滲透加速,可以預見的是AI將會快速步入到“應用繁榮期”,商業組織與科研機構的AI技術與應用研發將趨向多樣化,傳統的集群架構在靈活性上將難以滿足未來AI開發的多元需求。因此,如何將雲計算與AI融合,使得IT基礎架構既能具備雲的靈活性,也能保留AI所需的高性能,將成為推動AI真正成為一項社會性變革技術的重點所在。


分享到:


相關文章: