前景可觀的存算一體技術,到底有多難商用?

沒有一家公司的存算一體技術解決方案受到廣泛的市場認可。

策劃&撰寫:Lynn

最近,隨著5G商用和雲計算需求的迅猛增長,建設新一代適用各類AI場景的大規模數據中心成為各大運營商和巨頭公司接下來的工作重點,其中,提升性能和降低成本是大家最為關心的話題之一。

今年年初阿里達摩院發佈了2020年十大科技趨勢,它認為存算一體是突破AI算力瓶頸的關鍵技術。因為利用存算一體技術,設備性能不僅能夠得到提升,其成本也能夠大幅降低。

然而儘管存算一體技術方向廣受認可,英特爾、Arm、微軟等公司也均參與到該技術方向的投資,也有多家公司給出了可行的存算一體解決方案,但有一個不爭的事實是,沒有一家公司的存算一體技術解決方案受到廣泛的市場認可。

簡單來說,雖然“存算一體”概念很容易理解,即計算與存儲兩個模塊的融合設計以實現對數據的高效處理,但落到場景和商業發展推進過程中,它面臨的產業矛盾和難處遠超業內的想象。

存算一體技術有多複雜?

存算一體技術雖然極具前景,但其實非常複雜,因此很多大公司都選擇投資初創公司來完成這件事,而不是自己從頭去開發。

如美國著名的存算一體AI芯片初創公司Mythic,因其在存內計算芯片(IPU)有顯著的研究進展,在2019年剛剛結束的B+輪融資中,它就受到了軟銀、美光等投資者的支持,此前它還獲得了美國國防部的資金支持。此外,美國另一家專注於語音識別的存算一體AI芯片初創公司Syntiant,它的背書者們——微軟、英特爾、亞馬遜、博世等,也是廣泛分佈在計算和存儲領域的巨頭公司,甚至高通也邀請Syntiant來做可穿戴設備芯片的語音解決方案。

在國內,現在在這一領域有所探索的,包括知存科技、閃億半導體、憶芯科技等,也都是初創公司。

可以看見,大公司更傾向於選擇“站隊”,在巨頭們中,除了下游大力推進基於ReRAM的存內計算方案的臺積電,IBM是唯一公開自己存算一體技術佈局的公司。

前景可觀的存算一體技術,到底有多難商用?

在相變存內計算方面,IBM已經有了多年的技術積累,因此它也可以代表整個存算一體技術產業的先進水平。但儘管在核心部件PCM器件上有了十餘年的研究積累,並且IBM在2016年就透露了其關於存內計算的研發計劃,提出了混合精度內存計算的新概念,至今為止,IBM也只發布了基於該項技術的8位模擬芯片,定位是處理深度神經網絡。

與傳統芯片相比,該芯片在成本和功耗上有非常顯著的改進,包括存儲與計算模塊之間的通信成本也大大降低了,但是它的弱點也很明顯:因為AI訓練需要保持梯度計算的保真度和權重更新,現有AI芯片大多在16位精度以上,8位的精度看起來是沒有辦法廣泛使用的。

這也很讓人懷疑,費了大力氣研發出來的全新架構芯片,到底能不能走出實驗室?

不得不直面的“困境”

存算一體技術商用真的那麼難?

受計算機馮·諾依曼計算機體系架構影響,計算和存儲一直以來是相互分離的設計。但是隨著大數據時代的到來,以數據為中心的數據密集型技術成為主流系統設計思路,我們的關注點也不再僅限於數據的計算和加工,而更為看重的是對數據的“搬運”,即從根本上消除不必要的數據流動,這催生了計算與存儲的融合(存算一體)。

簡單來說,在傳統計算機的設定裡,存儲模塊是為計算服務的,因此設計上會考慮存儲與計算的分離與優先級。但是如今,存儲和計算不得不整體考慮,以最佳的配合方式為數據採集、傳輸和處理服務。這裡面,存儲與計算的再分配過程就會面臨各種問題,而它們主要體現為存儲牆、帶寬牆和功耗牆問題。

以存儲牆問題為例,因為計算與存儲各自獨立演進,且傳統的觀點認為計算系統性能受限於計算能力,因而過去幾十年產業界在計算方面的投入巨大。有數據顯示,過去二十年,處理器性能以每年大約55%的速度提升,內存性能的提升速度每年只有10%左右。結果長期下來,不均衡的發展速度造成了當前的存儲速度嚴重滯後於處理器的計算速度,內存瓶頸導致高性能存儲器難以發揮應有的功效,遭遇了所謂的存儲牆問題。

因此,存算一體技術的提出不僅僅要打破人們對傳統存儲和計算的認知,它還要解決這些已有的“歷史遺留”問題,實現存算之間更加低成本的“無縫對接”。

目前,業內提出了幾種可行的技術解決方向,其中

計算型存儲、存內計算、3D堆疊和類腦計算頗受關注,但究竟哪一種可行,眾說紛紜。


前景可觀的存算一體技術,到底有多難商用?

圖 | 3D堆疊

以現在最為火熱的存內計算技術來說,為了推動這項技術的發展,近兩年的芯片設計頂會ISSCC已經為其設立了專門的議程,同時2019年電子器件領域頂級會議IEDM有三個專門的議程共二十餘篇存內計算相關的論文。

其實存內計算的核心思想很簡單,就是把帶權重加乘計算的權重部分存在內存單元中,然後在內存的核心電路上做修改,從而讓讀出的過程就是輸入數據和權重在模擬域做點乘的過程,相當於實現了輸入的帶權重累加,即卷積運算。而同時,由於卷積運算是深度學習算法中的核心組成部分,因此存內計算非常適合AI,對未來AI芯片的存算一體和算力突破都有幫助。

前景可觀的存算一體技術,到底有多難商用?

但是不同於傳統的數字電路計算,存內計算是用模擬電路做計算,這對存儲器本身和存內計算的設計者都是一個全新的、需要探索的領域,IBM所研究的正是這個方向,裡面的難度可想而知。

不僅如此,隨著數據量的加大,功耗、存算之間的通信等方面都需要變革,以通信的硬件實現工藝來看,是採用光互聯技術還是採用3D堆疊的新型封裝實現高性能互聯,這就是一個大問題,因為採用不同的技術將會導致整體解決方案天壤之別。


AI芯片公司還是存儲芯片公司,存算一體技術應該由誰來做?

可以說,現在對於業內而言,樹在大家面前的首要問題就是達成技術方向上的共識,而想要達成技術共識之前,可能大家首先要解決的是,存算一體到底由AI芯片公司來做還是由存儲公司來做?

由AI芯片公司來做,技術方向更多偏向於計算型存儲或類腦計算,而由存儲公司來做,存內計算方向則會更容易被髮展和推動。

上文介紹的存內計算是從存儲的角度去做計算上的融合,尤其伴隨SSD產品(由NAND flash構成)的興起,因嵌入了ARM核和DRAM,NAND flash、ARM和DRAM、控制器和內部總線實際上構成了一個計算機系統,這讓存儲產品本身就可以做計算任務,因此也為存算一體提供了發展平臺。國內就有諸多初創公司在探索這個方向,尤其是由於AI的引入,各種數據的Key-Value只要直接存儲在硬盤裡,AI需要的數據就可以自動完成分類,可以顯著提升非關係數據庫的性能。

而計算型存儲則是將存儲做到計算芯片上,如現在很多處理器公司都在做片上存儲這件事,IBM設計的Blue Gene Active Storage(BGAS)結點就是一種‘存儲上的計算’系統,每一個BGAS結點包含32個處理器,每個處理器通過PCIe接口連接2TB的SLC NAND非易失閃存介質,大致就是這樣一個思路 。

當然不僅僅如此,超越馮·諾依曼架構之上,人的大腦就是一個典型的存儲計算系統,而仿照人腦的仿生系統也被認為是最有可能顛覆現有技術的終極發展方向。

作為電子復興計劃的一部分,DAPRA看中的就是這個更高級的系統——通過將電子元件編程為離散阻值狀態並將不同權重的電子元件相互卷積以建立一個類似突觸和神經元的系統,即神經擬態計算,又被稱為類腦計算。此前,國內清華大學類腦計算團隊打造的“天機芯”就是被稱為異構融合類腦計算芯片,復旦大學也在單晶體管邏輯架構上有突破性的進展,為存算一體發展奠定了技術基礎。然而需要指出的是,DAPRA團隊在這項研究上已經涉及了超過1800種混合材料,其難度之高可想而知,而後面架構搭建等都是商用道路上必須要邁過去的坎,因此可以說,類腦的存算一體系統遙不可及。

前景可觀的存算一體技術,到底有多難商用?

儘管類腦遙不可及,退回到現有的芯片設計上,存算一體的挑戰也是十分之多,如器件方面,現有的浮柵器件存儲就不適合存內計算;在芯片的工藝上,存算一體的設計和流片週期都將會很長,甚至連現有的EDA工具,目前尚沒有支持存算一體設計的。

總體來看,存算一體有IBM、知存科技等數十家大大小小企業在投入和探索,它們廣泛分佈在存儲、計算等領域裡,幾大技術方向也都在發展中。但是因可探索的方向很多,且沒有人知道哪一種是最適合商用的方向,可以說

整個市場還處在早期的百家爭鳴狀態。

降低成本,市場驅動存算一體

說到這裡,可以發現存算一體的未來商用發展前景是極其不明晰的。但看向應用端,存算一體的市場發展驅動卻是非常強烈的。

以數據中心為例,百億億次(E級)的超級計算機成為各國比拼算力的關鍵點,為此美國能源部啟動了“百億億次計算項目(Exascale Computing Project)”,希望於2021年至少交付一臺E級超算;中國則聯合國防科大、中科曙光和國家並行計算機工程技術研究中心積極開展相關研究,計劃於2020年推出首臺E級超算。但要想研製E級超算,科學家面臨的挑戰之中首當其衝的就是功耗過高問題。

隨著速度和性能要求的不斷提高,如果按現有設計方法,通過不斷增加處理器數量來研製超算,其體型和規模會越來越大,數據在存儲器和處理器之間進出所耗費的功率會越來越多。以現有技術研製的E級超算功率高達千兆瓦,需要一個專門的核電站來給它供電,而其中50%以上的功耗都來源於數據的“搬運”,

本質上就是馮·諾依曼計算機體系結構計算與存儲的分離設計所致。

如何降低功耗成為超算中心必須要解決的問題,各國科學家都在致力於降低超算功率,其中一些可行的技術方案包括讓存儲器更靠近計算器,減少數據行進距離;讓高性能存儲器向三維擴展而不是朝二維延伸;超算與閃存的結合等,而這些都隸屬於存算一體的技術方向。

另一方面,在邊緣計算和物聯網端,因存算一體能夠大幅提升性能和降低功耗,因此也被大家寄予厚望。

當然,不僅僅是成本,如阿里達摩院在發佈的技術報告所言,AI的出現與存內計算格外匹配,存算一體也將會改善現有的AI算力瓶頸。


分享到:


相關文章: