英特爾等推動深度學習與超級計算相融合

【概要】英特爾和美國國家能源研究科學計算中心、斯坦福大學聯合開發出一套深度學習系統,可在15 Petaflops的超級計算機上運行。

機器學習是一種人工智能技術,在商業應用中取得了前所未有的成功。但是,機器學習在科學高性能計算中應用卻很有限。原因何在?高級機器學習工具不是專為大數據集設計,例如用於研究恆星和行星的工具。英特爾、美國國家能源研究科學計算中心(National Energy Research Scientific Computing Center, NERSC)及斯坦福大學的聯合團隊改變了這一情況。他們研發出一套深度學習系統,可在15千萬億次每秒(petaflop)的計算機上工作。通過在超級計算機科裡(Cori)上測試運行,該系統表現出了處理大型數據集的能力。

在超級計算機上使用機器學習技術,科學家就能從大型複雜數據集中得到更多信息。加速器等強大儀器能產生巨型數據集。這款新軟件可以讓世界上最大的超級計算機將這類數據用於深度學習,得到的信息可促進地球系統建模、聚變能和天體物理學。相關研究論文“15PF的深度學習:科學數據的監督和半監督分類”文章中描述發表於《高性能計算、網絡、存儲和分析國際會議論文集》(Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis)。

機器學習技術有望讓科學家從加速器、光源、望遠鏡和計算機模擬等產生的大型複雜數據集中提取寶貴信息。雖然這些技術在多種商業應用中取得了巨大勝利,但是它們在科學的高性能計算中應用有限,因為現有工具不是為許多科學領域中發現的太字節或千兆字節級數據集而設計。

英特爾、美國國家能源研究科學計算中心及斯坦福大學的聯合團隊攜手應對在太字節或千兆字節級數據集上應用深度學習技術所產生的問題。該團隊開發出首款在15千萬億次每秒的計算機上運行的深度學習軟件。該軟件可執行大型科學數據集進行的大量訓練運行,展現出其用於數據密集型應用的可擴展性。這些運行使用了美國國家能源研究科學計算中心超級計算機科裡所有的物理和氣候相關數據集。運行得到的峰值速度在11.73至15.07千萬億次每秒之間(單精度),平均持續性能為11.41至13.47千萬億次每秒。


分享到:


相關文章: