真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

NAND顆粒製成的SSD,目前已經逐漸在取代HDD,成為PC存儲的首選。不過,NAND SSD雖然在性能、穩定性上表現出了比HDD更好的態勢,但是其容量較小、成本和價格較高的弱點一直沒有得到很好的改善,尤其是在NAND顆粒受制於存儲原理無法進一步縮小工藝尺寸、需要3D堆疊技術來製造更大容量的產品之後,這一點變得尤為突出。

在這種情況下,如何進一步提高NAND顆粒的容量呢?業界終於拿出了QLC方案。QLC方案究竟是什麼,目前已經出現在市場上的QLC產品都有什麼樣的特性呢?本文就和你一起來了解一下。

目前我們在市場上看到的NAND SSD以SLC、MLC和TLC為主。從名稱來說,SLC,也就是Single-Level Cell,單倍單元。MLC是指Multi-Level Cell,字面意思是多倍單元,實際上是指2倍。TLC是指Trinary-Level Cell,也就是三倍單元。

從存儲能力來看的話,SLC每單元只存儲1bit數據(單倍),存儲能力最差,但是速度和壽命最好,價格最為昂貴。MLC則是2bit(2倍),有一定改進,速度和壽命表現也不錯,價格也比較貴;TLC則更強(3倍),每單元可以存儲3bit數據,速度和壽命表現一般,價格便宜不少。

除了上述三種常見的顆粒外,目前市場上正在準備上市的新品QLC,全稱是Quad-Level Cell,字面意思是4倍單元,也就是每單元可以存儲4bit數據。換句話來說,在條件相當的情況下,QLC的顆粒存儲能力比TLC大了33%,是MLC的2倍,是SLC的4倍。QLC在手,TB級別SSD不是夢。

從這一點來看,QLC似乎很有發展前途,但是QLC遲遲不上市的原因也很簡單,那就是它的壽命情況表現不佳,性能也不如前輩們。那麼,NAND顆粒為什麼會有SLC、MLC和TLC的差異呢?新登場的QLC到底Q在哪裡呢?為什麼大家對它的壽命、性能充滿擔憂呢?

電子、浮柵、磨損——從NAND顆粒本身談起

為了解釋QLC為什麼會有這樣的問題,本文要先繞一個大彎子,從NAND顆粒的結構開始分析。這一部分內容,在本刊之前的文章中也有解釋,在本文中我們需要再度解讀一下。只有經過這一部分的解讀,我們才會更為深刻地理解為什麼QLC壽命低、速度慢,人們應該如何做出針對性的改進。

NAND單元的基本結構

以最常見的N溝道耗盡型MOSFET為例,如果定義單一存儲單元的門控部分是最上層的話(頂部),那麼門控部分下方是兩個絕緣的ONO(oxide-nitride-oxide,氧化物-氮化物-氧化物),也被稱作Inter Poly Dielectric(簡寫為IPD)所隔開的浮柵(Float Gate),再下方則是隧道氧化物(Tunnel Oxide)以及硅底。門控和浮柵之所以如此設計,是因為需要獲得最大的電容值。因為柵極之間的電容是NAND工作的關鍵因素,通過門控可以控制浮柵。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲N溝道耗盡型MOSFET的示意圖,這張圖對理解NAND芯片為什麼不能繼續使用更先進、更微小的工藝至關重要。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲顯微鏡下的N溝道耗盡型MOSFET,尤其注意ONO部分以及包夾在ONO部分中的Floating Gate浮柵。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲字線和位線,這張圖也可以想象成一個俯視圖:紅色的字線,是N溝道耗盡型MOSFET的頂部,藍色的是位線,是N溝道耗盡型MOSFET的底部。

在瞭解NAND單元的基本結構後,還需要了解字線和位線的概念,有關字線和位線,可以被類比為地圖表面的經線和緯線,利用這兩條線的交叉點才能確定一個存儲單元的實際位置。

NAND單元如何讀寫數據

根據英特爾的資料,在實際操作中,當人們對使用25nm工藝製造的NAND基本存儲單元進行操作時,會使用大約20V的電壓加載到該單元所在的字線上。由於字線的連通性,這條字線的所有單元都會獲得20V的電壓。在這種情況下,除了所選單元的位線外,其餘所有單元的位線都會被施加大約6V的電壓,而目標單元的位線電壓為0V。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲NAND工作流程示意圖

這樣一來,目標單元的電壓差超過閥值,電子能夠穿過隧道氧化物流入浮柵,從而對單元的存儲表徵進行改變。此時,其餘的單元由於存在20V字線、6V位線的電壓,因此增加了位線和浮柵之間的電容,且相對電壓較低,電子不能穿過隧道氧化物,所以單元沒有任何變化。

當一個基本單元寫入了數據後,如果要讀取它,那麼可以測量這個單元對應的字線和位線之間的電壓。這是因為寫入數據時,電子流入浮柵後形成了電壓,字線和位線之間的電壓就可以用於確定是否存在數據、對應怎樣的數值。

此外,當人們需要清空數據時,可以對單元進行反向操作,比如將字線設置為0V,位線設置為20V,這樣浮柵中的電子就會迴流,流入位線或者硅底,最終會清空NAND單元中的數據,使得單元空置。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲幾種不同的NAND工作時電壓狀態,從上向下分別為每個NAND存儲單元存儲一個數據的SLC、存儲2個數據的MLC、存儲3個數據的TLC和存儲4個數據的QLC單元。

結合使用上述方法,人們可以快速、簡單地存儲、讀取數據。但是這種方法也存在致命的問題,那就是每次寫入、擦除數據的時候,都需要較高電壓才能完成。周圍的絕緣層(比如在浮柵上下的ONO和隧道氧化物),在每一個高電壓週期都會被“磨損”,也就是材料對電子的控制能力會變弱,這會使得這些材料失去絕緣性,最終電子會逃脫浮柵,電壓狀態會發生變化。這是NAND顆粒的本身原理所決定的,不會隨著存儲方式改變而改變,但人們可以不斷改用新的材料和技術提高NAND顆粒的抗磨損能力,從而提高單元壽命。

差值決定壽命——QLC的桎梏

在前文,我們知道了NAND確定是否存在數據的方法是使用電壓來衡量。如果浮柵的電壓無法維持固定的值,那麼單元會表現出錯誤的數據值,且隨著擦寫次數增多,浮柵儲存電荷的能力就會不斷下降,隨後顆粒電壓會逐漸漂移。但是,不同的數據存儲方式在應對電荷漂移時的結果完全不同。

SLC:電壓差值巨大,容錯能力極強

在SLC上,NAND只有兩種狀態,這兩種狀態之間的電壓差值比較大,這意味著一些輕微的效率降低可能不會很快地影響到數據存儲的有效性。SLC狀態下的顆粒,只需要有2個工作狀態就可以確定數據了。比如浮柵以電容擁有15V電壓(估計值,實際可能隨著工藝、材料差異有所不同)作為數據0,0V作為數據1的話,那麼兩個狀態之間存在巨大的差距使得任何測量設備都無法忽視,即使出現點問題也不是很難處理。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲SLC NAND由於性能強勁,目前主要被用做緩存或者高端數據存儲設備。

假設SLC一開始單元中可以維持較高的電壓差值,隨著浮柵磨損電壓差值逐漸漂移,只能以10V/3V甚至6V/2V、4V/1V進行判斷,這在理論上也是完全可行的。足夠高的電壓差值使得SLC耐久性能極高,SLC的超長壽命正是來自於此。

MLC:狀態變多,差值變小

同樣的問題在MLC上就更復雜一些。假設依舊存在15V的電壓差,MLC上判斷數據狀態也就是00,01,10,11四種狀態,需要3個電壓差才能確定。假設不同狀態的電壓差平均分佈,那麼MLC最理想狀態下需要有四個狀態,那就是15V、10V、5V、0V——相比SLC而言,MLC的兩個相鄰狀態之間的電壓差急劇縮小,只有5V(SLC則高達15V)。

從結構上來看,MLC的顆粒和SLC顆粒不存在任何差異,都會由於浮柵中電子不斷逃逸而最終導致電壓值變得不那麼明顯,SLC的“數據差值”高達15V,MLC只有5V的話,可能MLC經過長時間磨損後達到10V、8V、6V、3V時表徵4個狀態就已經很勉強了,如果繼續磨損的話,MLC顆粒就可能無法清楚地表徵4個狀態從而走向報廢的邊緣。

TLC:8個狀態,差值急劇萎縮

繼續看TLC的話,需要表徵8種狀態,每種狀態代表3bit信息,分別是000,001,010,011,100,101,110,111,單元還是那個單元,但是電壓狀態更多了,在15V的範圍內,存在8種狀態會導致每種狀態的電壓差急劇縮小,平均只有大約不到2V,磨損導致電壓漂移的空間極小。

TLC這種極小的電壓差,使得單元在長期使用後只要稍微出現電壓漂移,就可能發生狀態之間的“糾纏”,因此早期TLC的P/E壽命只有100~150次,也就是TLC顆粒只能抵抗100~150次徹底讀取、清除數據的循環。但是隨著技術不斷改進,TLC的壽命也在增加,目前已經普遍提高到800~1000次左右。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲三星3D TLC NAND顆粒是市場常見的產品。

QLC:16個狀態,挑戰存儲的極限

最後來看QLC的話,需要表徵16種狀態,也就是每種狀態代表4bit信息,在15V電壓內,16種狀態之間的電壓差大約只有1V,這使得本來就不夠耐久的電子磨損效應非常明顯,從而導致電壓漂移的NAND顆粒讀寫次數變得極為有限,部分數據顯示早期QLC顆粒只有大約100次P/E全週期循環壽命,這個問題是否無解呢?我們下文再來研究這個問題。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲需要存儲16個狀態,QLC堪稱存儲的極限。

技術進步,問題解決——QLC發展的曙光

繞了一個大圈子,我們回到QLC上來。上文已經從理論上分析了為什麼從SLC到QLC,預期壽命一路下降在結構和設計上的根本原因。從文中可知,QLC容量大是有代價的,那就是存儲更多的電壓值來表徵數據,這使得QLC的穩定狀態岌岌可危。

那麼是不是實際產品中壽命正如文中分析呢?答案是否定的。原因是文中的分析值得是在技術不變的情況下,不同類型的產品存在的壽命差異。但是由於MLC尤其是TLC在快速成為主流,大量延壽方案和技術的應用,尤其是堆疊工藝的加入,使得QLC這樣的產品壽命已經不是難題。

從NAND顆粒的原理來看,浮柵存儲電子,其周圍的ONO和隧道氧化物提供絕緣性。在較老的工藝下,ONO和隧道氧化物厚度更厚、尺寸更大,絕緣性能更好,較新的15、16nm等工藝下則相反。但是新工藝能有效縮減NAND的尺寸從而提高單位面積數據存儲密度,這就形成了一對矛盾。解決這對矛盾的辦法就是堆疊技術。

堆疊技術使得人們可以使用40nm這樣較老的工藝、通過多層堆積的方式提高單位數據密度。更老的工藝帶來了更抗磨損的絕緣層,另外針對浮柵的改進也使得電子不那麼容易逃逸。一個具體的例子就是TLC,在改用老製程、並改善材料絕緣性之後,之前TLC數百次的P/E壽命已經被提升至了平均800~1000次。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲使用3D堆疊技術後,廠商對工藝的要求反而沒有那麼嚴苛了。

同理,相同的技術和工藝也可以使用在QLC單元上,通過堆疊技術和尺寸較大的工藝、新材料、新的讀寫算法等技術,目前英特爾和美光宣稱QLC顆粒已經能夠做到1000個P/E循環。宣傳歸宣傳,一些QLC產品廠商比如Maxio表示500個P/E循環還是可以保證的,並且會隨著未來發展進一步提升。

實際上,QLC顆粒單純依靠存儲單元本身的能力,已經很難保證數據存儲的穩定性和可靠性了,對於這一點,製造商可能需要更為嚴苛的糾錯算法來減少由於漂移引起的信號位錯誤,這些算法必須使用硬件來確保數據完整性,這可能會導致更高的功耗或者控制器中需要更多的晶體管。另外,額外的算法還可能帶來性能的負面影響,但是會增加P/E,目前這類技術還需要進一步衡量。

性能方面,QLC由於需要一次寫入、讀取4bit數據,再加上電壓控制要求很高,因此其速度表現目前是不如前輩MLC、TLC的,尤其是寫入速度。一些測試數據和性能顯示,QLC的讀取速度可以基本做到和TLC持平,至少在SATA接口下能夠達到500MB/s以上。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲QLC與TLC顆粒的規格對比,隨著技術發展,QLC在寫入能力上又有提升。

寫入速度方面,目前部分廠商的產品宣稱QLC大約是TLC的70%左右,可達到360MB/s,但是另一些產品又證明其可以滿足SATA接口500MB/s的需求,這可能和廠商設計以及控制芯片相關。比較差的就是I/O性能了,QLC大概只有TLC的一半,延遲也略高一些,主要是P/E編程時間偏長。

TB級別容量——無可限量的未來

在解決了這些問題之後,QLC的真正實力也就是巨大的容量就開始逐漸爆發出來了。根據東芝的預測,QLC SSD主要應用在商業場合時,將位於HDD和高性能SSD之間,100TB的QLC SSD性能和12臺8TB的HDD硬盤陣列的性能相當,持續讀取能力都是大約3GB/s,但是其SSD的待機功耗更低,更重要的是IOPS,HDD受制於先天結構,IOPS性能最多也就2000左右,但是SSD即使是QLC顆粒,也能夠達到50000左右的性能水平,隨機能力完勝HDD。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲QLC相比HDD,還是有巨大優勢的。

在這種情況下,東芝提出了一種方案,就是使用QLC的SSD作為HDD和高速SSD之間的緩衝,利用其大容量和較高的隨機讀寫速度來提高系統的響應速度。這種應用方案對一些數據中心來說頗有吸引力,因為這些數據中心要求較高的IOPS和較大的存儲容量,如果使用MLC或者TLC的SSD,那麼成本會變得很高,使用HDD又達不到要求。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲在東芝的想法中,QLC可以作為高速SSD和HDD之間的過渡階層。

QLC SSD的出現,恰好能滿足這類用戶的需求。對於這一點,英特爾也表示出積極的態度。英特爾與美光面向企業級用戶推出的3D QLC SSD採用的是WORM方式也就是Write-Once leaRn Many一次寫入多次讀取。因為這類存儲方式是大多數數據中心的首選,很多用戶只是需要讀取大量的數據,並不會經常改寫它們。況且對數據中心來說,超大的容量帶來了極大的空間自由,平衡讀寫技術能夠在這裡發揮得淋漓盡致,壽命也會得到最大限度的保證,QLC應用於數據中心真是恰到好處。

對普通玩家來說,QLC的SSD也可以作為大容量數據倉庫替代HDD使用。美光之前預測,2021年普通玩家平均會有4塊SSD,SSD的平均容量會達到597GB,也就是每個人大約2.4TB容量。在這2.4TB的個人SSD中,可能只有512GB/480GB的SSD使用高速的MLC或者TLC,安裝系統或者常用軟件,剩餘的1TB~2TB空間則由QLC接管,因為這部分內容讀取居多,一般來說很少寫入,可以完美髮揮QLC的特性。

目前已經有廠商展示了QLC SSD的實際產品,來自於廠商Maxio,顆粒來源英特爾。Maxio是一家SSD控制芯片廠商,本次展示的是QLC SSD的開發原型。這款原型SSD驅動芯片基於MAS0902A-B2C無DRAM控制器以及英特爾的N18A 3D QLC顆粒,MAS0902A-B2C具有兩個處理內核,並支持一些廠商專有技術,包括AgileECC 2,WriteBooster 2(SLC緩存),虛擬奇偶校驗恢復等。由於控制器採用了GlobalFoundries的40nm工藝,因此整體尺寸小巧,Maxio宣稱其是最小巧的SSD控制器之一。

在壽命方面,正如前文所說,英特爾和美光宣稱自己的產品P/E壽命有1000次,但是Maxio表示實際情況並沒有這麼高,大約500次左右,因為目前是早期開發狀態,最終的版本還將有一定的提升。在DWPD(Device Write Per Day)也就是每天寫入數據方面,這款SSD評級為0.3,這是一個典型的廉價SATA SSD的評級,考慮到QLC的定位和海量的容量,這個問題對很多用戶來說不是那麼重要。

性能方面,Maxio的QLC SSD在使用SATA接口的情況下和TLC的SSD基本相當,讀取和寫入速度都突破了500MB/s,4K隨機寫入能力也很強勁,顯示出了這款控制芯片強勁的編程能力。另外,Maxio還宣稱他們有另一顆芯片可以支持DRAM緩存,這樣一來QLC SSD的壽命和性能還會有進一步提升。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲QLC SSD的性能,目前已經基本趕上了SATA接口的TLC SSD。

Maxio還展示了一些實際產品的信息。整個4TB的QLC SSD採用了一塊2.5英寸的PCB,上面只有寥寥4顆3D QLC SSD芯片,單顆芯片的存儲容量高達1TB。考慮到這是一個早期工程樣品,這意味著QLC SSD的容量潛力極為驚人。如果使用更大的3.5英寸PCB,雙面佈置總計16顆芯片的話,那麼QLC SSD將會達到16TB的容量,這已經遠遠超過市場上所有的HDD了,當然價格也會高很多。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲QLC SSD正面照片,依舊是工程樣品。

真的比TLC還爛嗎?看QLC顆粒能否終結SSD高價低容量時代

▲Maxio展示的QLC SSD,採用英特爾N18A 3D QLC顆粒。

總的來看,不管之前人們對QLC有多少的不滿和誤解,即使理論上4bit帶來了非常狹小的磨損空間,但是QLC海量的存儲能力和相對於TLC、MLC較低的價格會逐漸平衡這一切,尤其是在技術不斷改善後,QLC也從“基本不可用”逐漸走向“水準之上”。特別是大量的市場對持續寫入數據不那麼敏感,只需要更大的空間、更快速的讀取和更低的功耗時,這都是QLC SSD的機會。

可以預計的是,在未來1~2年左右,QLC就能夠走入主流市場,玩家們很可能在QLC SSD中存儲數百GB的4K高清視頻或者超大的遊戲文件,MLC或者TLC將接管系統和那些快速讀寫的領域,數據中心也將迎來QLC的大規模進駐,QLC的海量未來是深不可測的。


分享到:


相關文章: