利用內存式運算架構助力AI加速器，運算速度是現行GPU一萬倍！

2018-05-04 09:05:26 愛板網

新創公司、企業巨擘和學術界開始重新審視十年前開發的處理器架構，看好它或許剛好就是機器學習(machine learning)的理想選擇。他們認為，“內存式運算”(In-Memory Computing；IMC)架構可望推動新型的人工智能(AI)加速器進展，使其速度較現行的GPU更快1萬倍。

這些處理器承諾可在CMOS微縮速度放緩之際擴展芯片性能，而要求密集乘法累積數組的深度學習算法也正逐漸獲得動能。這些芯片雖然距離商用化上市還有一年多的時間，但也可能成為推動新興非揮發性內存成長的引擎。

例如，新創公司Mythic瞄準在閃存(flash)數組內部進行神經網絡運算任務，致力於從模擬領域降低功耗。該公司的目標是在2019年底量產芯片，成為率先推出這一類新芯片的公司之一。

美國聖母大學(Notre Dame)電子工程系系主任Suman Datta說：“在我們學術界大多數的人認為，新興內存將成為實現內存處理器(processor-in-memory；PIM)的技術之一。採用新的非揮發性內存將意味著創造新的使用模式，而內存式運算架構將是關鍵之一。”

Datta指出，在1990年代，有幾位學者試圖打造這樣的處理器。諸如EXECUBE、IRAM和FlexRAM之類的設計都“失敗了，而今，隨著相變內存(PCM)、電阻式RAM (RRAM)和STT MRAM等新興內存出現，以及業界對於機器學習硬件加速器的興趣濃厚，開始振興這個領域的研究。不過，據我所知，大部份的展示都還是在組件或組件數組層級進行，而不是一個完整的加速器。”

其中一家競爭對手來自IBM於2016年首次披露的“電阻處理器”(Resistive Processing Unit；RPU)。這是一款4,096 x 4,096交叉數組的模擬組件。

IBM研究員Vijay Narayanan認為，“其挑戰在於找出正確的模擬內存元素是什麼——我們正在評估相變、RRAM和鐵電。”Vijay Narayanan同時也是一位材料科學家，他主要的研究領域是在高K金屬閘極。

在2015年，美國斯坦福大學(Stanford University)也曾經發布在這一領域的研究。中國和韓國的研究人員也在追求這一理念。

為了實現成功，研究人員需要找到兼容於CMOS晶圓廠的內存組件所需材料。此外，Narayanan說，「真正的挑戰」就在於必須在施加電壓時展現對稱的電導或電阻。