既快又經濟 按“人類思維”分析數據的祕方是什麼?

現在,無論是政府還是企業,都希望通過數字化轉型提升競爭力,數字化繞不開兩個維度,應用和數據。

無疑,數據將成為改變傳統的度量依據,流程的優化、產品的迭代、商業模式的創新,都將依據數據來驅動。

在應用的時候,從邊緣到核心再到雲中,比數據量更有趣的是數據分析的價值,面對爆發式增長的數據,企業需要實時的決策,實現高效管理。

據IDC統計,到2025年,實時數據佔比將達到29%,為了實現數據實時分析,英特爾發佈以數據為中心的全方位技術創新戰略,開發、記錄,傳輸,存儲和處理數據的技術,讓用戶存儲更多的數據,以最快的速度傳輸數據,並處理從雲端到邊緣的一切數據。

如何擺脫“有苦說不出”

在進出海關時,通過指紋識別的自動通道會讓我們更加便捷,在公安領域,其實指紋比對既要高速還要精度,比如指紋系統從現場採集的原始指紋數據,經過預處理和特徵提取之後,會形成結構化的點集,再將其與後臺數據庫中百萬量級的指紋實例進行比對。

看似短時的過程,其實需要後臺的邏輯判斷分支,這樣一來,解決方案的性能會嚴重依賴於內存資源的可用性,同時對通用計算內核的性能需求也非常高。

類似的場景會越來越多,如何設計高性價比的存儲節點和計算節點、如何快速有效地進行軟硬件適配、如何在雲平臺上達到對海量數據進行高效比對等問題。

說到底,AI時代需要創新存儲架構實現海量數據的實時、智能處理。

從SSD誕生之初的SLC到MLC,再到TLC,即將來臨的QLC,單位面積內存儲的數據越來越多,容量越來越大。

但對於性能增益並不明顯,比如目前市面主流的NVMe SSD的隨機讀性能大約在60萬IOPS左右,當然有更高甚至突破百萬IOPS,但並不常見,而未來結合3D NAND和QLC技術的SSD,讀性能大致相當,但寫性能還稍有下降。

當然,這裡面也有接口帶寬方面的因素。未來PCIe 4.0普及以後,可預見的是,更大容量的QLC SSD並不會比現有SSD性能更好,SSD的容量越來越大,但性能趨於穩定,與磁盤的發展路線類似了。

性能大致相當,相同價格條件上,難道不是容量越大越划算嗎?從成本角度而言的確如此。

但從企業應用角度,尤其是非容量需求型應用角度,相同的性能容量更大,意味著單位容量的性能越低,即每GB容量能實現的IOPS降低。因此對於需要較高性能,但並不需要大容量存儲的應用而言,有種“有苦說不出”的感覺。

縱觀市面上主流的高性能SSD,通常容量都比較大,小容量高性能(比如50萬IOPS為參考)的SSD幾近於無。

代表全面創新的英特爾® 傲騰TM 數據中心級持久內存解決方案(以下簡稱Optane)就是一種專門用於數據中心使用的新型存儲器和存儲技術,可在DRAM和SSD之間實現大型持久存儲器層,又快速還經濟實惠。

按人類的思維分析數據

企業需要完整業務數據進行實時分析時,但“實時”其實是可以有數值的。

人類的“實時反應時間”詩幾百毫秒,對於系統來說,用毫秒衡量思維速度,則提供數據的系統組件的時延,必須用納秒度量,才能使組合時延接近人類思維的下限(550 毫秒)。

既快又經濟 按“人類思維”分析數據的秘方是什麼?

也就是說,數據保留在內存中並接近 CPU 將使時延保持在納秒級。但是,在對存儲發出請求之後,時延將從納秒級變為毫秒級。

但英特爾希望按照人類思維的節奏呈現給用戶分析數據,Optane就是將更多的數據移近處理器,根本上改變了可以經濟高效方式放置在處理器附近的內存量,以便實時訪問、處理和分析數據,而無需先從存儲器檢索數據,讓客戶洞察數據的時間有望不斷縮小。

既快又經濟 按“人類思維”分析數據的秘方是什麼?

從技術上來看,Optane並不同於傳統認知中的(NAND)SSD,相比於NAND SSD,其應該是SSD的另一技術分支。NAND SSD通過改變電子負荷來實現數據的存儲,每次負荷的改變都意味著損耗,即SSD的PE次數,SSD的壽命問題是眾所周知的,當然目前主流SSD內使用的均衡算法也能實現延緩壽命的效果。

與此同時,Optane單片SSD容量雖然只有375GB,卻能提供超過50萬IOPS的隨機讀寫性能,讀寫性能均衡,這也是Optane相對於NAND SSD的一大區別,這也使得Optane比NAND SSD更適合寫密集型應用場景,比如公安領域的指紋識別比對、石油、製造等行業場景。

而Optane則使用新型材料,更類似於PCM(Phase Change Memory,簡稱PCM)相變存儲,從原理上就與NAND不同,天然具有更好的PE次數。

之前,E企研究院針對青雲QingCloud基於MySQL開發的分佈式數據庫RadonDB中,以NAND SSD為數據庫提供存儲,對比Optane(同樣單盤375GB)做緩存與NAND SSD做存儲進行對比,測試結果同樣表明,相比單純使用NAND SSD做數據庫存儲,在OLTP模式下,加入Optane做緩存後,RadonDB數據庫性能有4倍以上的性能提升,且平均響應時間為原來的四分之一以下。

既快又經濟 按“人類思維”分析數據的秘方是什麼?

在青雲QingCloud分佈式數據庫環境中,在加入Optane做緩存後,2節點RadonDB數據庫性能提升了4倍左右,三節點則提升到了原來的6倍,數據庫平均響應時間也將為NAND SSD做數據存儲下的四分之一和六分之一。

然而這仍非孤例,Intel實驗室的數據顯示,同樣在數據庫環境下,加入Optane做緩存後,數據庫性能亦有3倍提升,與之相呼應的延遲也僅為原來的三分之一。

既快又經濟 按“人類思維”分析數據的秘方是什麼?

就基準測試數據來看,Optane與NAND SSD的性能並沒有相差那麼大,為何在應用場景下卻有數倍的性能提升?

其實就是使用基準測試工具檢驗Optane與NAND SSD的讀寫性能時,其負載通常較為純粹,如100%讀或寫壓力。雖然同樣為實驗室環境,基於應用的測試更加接近真實的負載,讀寫IO模型要更為複雜,且會產生變化。這使得Optane能夠將寫性能和低延遲不斷快速累積,進而獲取與基準測試結果並不成比例的性能提升。

既快又經濟 按“人類思維”分析數據的秘方是什麼?

可以看出,在數據存儲層面,英特爾正在使用Optane獨特的存儲器技術釋放數據價值,讓客戶用更加經濟的方式存儲數據,而從邊緣計算到核心的數據中心,從基礎架構到雲、到應用、從數據傳輸到為軟件和算法提供動力,英特爾已經超越處理器市場,讓數據更加有價值。


分享到:


相關文章: