在計(jì)算機(jī)體系結(jié)構(gòu)中,內(nèi)存架構(gòu)是層級(jí)制的。從寄存器、高速緩存、DRAM內(nèi)存再到硬盤,存儲(chǔ)容量越來越大,但延遲也逐漸增高。

SCM存儲(chǔ)級(jí)內(nèi)存具備非易失性、極低存取延遲(DRAM-like)、低廉的單位容量成本(Disk-like)和固態(tài)無活動(dòng)部件(SSD-like)特點(diǎn),可利用大容量和非易失的存儲(chǔ)特性來填補(bǔ)DRAM內(nèi)存與TLC閃存SSD之間的空缺。

既然要用做數(shù)據(jù)緩存,那么必然會(huì)有大量寫入,SCM存儲(chǔ)級(jí)內(nèi)存需要具備較高的寫入耐久度。對(duì)比來看,消費(fèi)級(jí)SSD通常提供0.3DWPD,企業(yè)級(jí)讀取密集型1DWPD,企業(yè)級(jí)混合讀寫型3DWPD,企業(yè)級(jí)寫入密集型10DWPD,而今天我們要測(cè)試的SCM存儲(chǔ)級(jí)內(nèi)存則具備高達(dá)100DWPD的寫入耐久度,即每天寫入100倍全盤容量的數(shù)據(jù)可用5年。

本次我們將對(duì)比測(cè)試英特爾傲騰P5800X和大普微(DapuStor)Xlenstor2 X2900P兩款SCM存儲(chǔ)級(jí)內(nèi)存產(chǎn)品??纯丛诎硫v停產(chǎn)的背景之下,大普微X2900P能否接替前者,引領(lǐng)SCM這個(gè)領(lǐng)域。

作為SCM先驅(qū),傲騰使用英特爾獨(dú)有的3D XPoint閃存,擁有出色的低延遲和高寫入耐久度特性,開辟了介于DRAM內(nèi)存和普通SSD之間的全新分層空間。
傲騰使用的3D XPoint存儲(chǔ)介質(zhì)支持字節(jié)尋址,并支持覆蓋寫入,具備諸多NAND閃存夢(mèng)寐以求的先進(jìn)特性。

不過隨著美光中途退出,3D XPoint閃存的應(yīng)用者只有英特爾傲騰一家。發(fā)展至第二代的3D XPoint閃存仍然只有4層堆疊,成本劣勢(shì)最終將傲騰推向了停產(chǎn)。

大普微是全球第二家推出SCM存儲(chǔ)級(jí)內(nèi)存的廠商,推出了Xlenstor系列的SCM產(chǎn)品。對(duì)標(biāo)P5800X的X2900P基于自研DPU600主控和固件,搭配鎧俠96層堆疊XL-FLASH存儲(chǔ)介質(zhì)。


XL-FLASH將閃存平面數(shù)量從普通NAND閃存的2個(gè)或4個(gè)直接提高到16個(gè),每個(gè)頁的容量也從普通閃存的16KB降低到4KB,經(jīng)過一系列優(yōu)化之后,XL-FLASH就成為一種比普通SLC更強(qiáng)大的閃存。
大普微X2900P的隨機(jī)讀寫延遲分別低至21微秒和8微秒,耐久度指標(biāo)高達(dá)100DWPD,遠(yuǎn)超普通TLC閃存企業(yè)級(jí)固態(tài)硬盤,成為英特爾傲騰的有力挑戰(zhàn)者。
以下為大普微X2900P與英特爾傲騰P5800X拆解評(píng)測(cè)對(duì)比:

CrystalDiskInfo信息識(shí)別:英特爾傲騰P5800X使用PCIe 4.0 x4接口,NVMe 1.3協(xié)議。大普微X2900P使用PCIe 4.0 x4接口,NVMe 1.4協(xié)議。

01
ezFIO腳本測(cè)試
ezFIO是經(jīng)NVM Express推薦的企業(yè)級(jí)SSD綜合測(cè)試,它是一個(gè)可重復(fù)進(jìn)行的穩(wěn)定態(tài)性能測(cè)試腳本。在測(cè)試開始前有兩次全盤容量寫入的預(yù)處理階段,幫助模擬企業(yè)級(jí)SSD的長(zhǎng)期性能。ezFIO同時(shí)支持Windows和Linux平臺(tái),測(cè)試完成后可自動(dòng)生成測(cè)試報(bào)告。以下成績(jī)?cè)谑荓inux系統(tǒng)下搭配fio 3.29測(cè)得。
在穩(wěn)定態(tài)下大普微X2900P可以實(shí)現(xiàn)7513MB/s順序讀取速度,英特爾傲騰P5800X也獲得了7407MB/s的成績(jī)。

4K隨機(jī)讀取,低隊(duì)列深度下傲騰優(yōu)勢(shì)比較明顯,但隊(duì)列深度達(dá)到16之后延遲開始快速上漲,最終大普微以142微秒延遲和1793K IOPS實(shí)現(xiàn)了反超。圖中我們還加入了使用144層堆疊3D TLC閃存的Solidigm D7-P5520 7.68TB企業(yè)級(jí)SSD作為對(duì)照。


4K隨機(jī)寫入,低隊(duì)列深度下英特爾和大普微難分高下,隨著隊(duì)列深度提升,傲騰笑到了最后。作為對(duì)照的D7-P5520本身并不弱,只是對(duì)手實(shí)在太強(qiáng)了。


4K隨機(jī)混合讀寫,讀取寫入比7:3。從高到低來看,大普微X2900P、英特爾傲騰P5800X、Solidigm D7-P5520的穩(wěn)定態(tài)隨機(jī)混合讀寫IOPS分別為1612359、1586130、434530。

再來看4K隨機(jī)混合讀寫的QoS表現(xiàn),從上到下分別是英特爾傲騰P5800X 800GB、大普微X2900P 800GB和Solidigm D7-P5520 7.68TB。



大普微的寫入部分延遲更好,而傲騰則在讀取延遲上更具優(yōu)勢(shì)。

02
SNIA SSS PTS-E 2.0
SSS PTS的全稱為Solid State Storage Performance Test Specification,即固態(tài)存儲(chǔ)性能測(cè)試規(guī)范,它由SNIA存儲(chǔ)網(wǎng)絡(luò)行業(yè)協(xié)會(huì)制定,包括針對(duì)企業(yè)級(jí)SSD的PTS-E規(guī)范以及針對(duì)消費(fèi)級(jí)SSD的PTS-C規(guī)范。

PTS測(cè)試在設(shè)備而非文件系統(tǒng)級(jí)別進(jìn)行,通俗的說就是SSD在沒有分區(qū)的狀態(tài)下進(jìn)行。PTS測(cè)試的是SS(Steady State穩(wěn)定態(tài))性能,而非FOB(Fresh-Out-of-the-Box開箱狀態(tài)即出廠態(tài))表現(xiàn)。

SSD PTS測(cè)試報(bào)告會(huì)展示測(cè)試平臺(tái)的軟硬件配置情況(包括主板、CPU、內(nèi)存以及操作系統(tǒng)、測(cè)試軟件版本等)、受測(cè)SSD的信息(包括制造商、型號(hào)、序列號(hào)、固件版本、容量、擦除方式、寫入緩存開關(guān)等)、測(cè)試設(shè)定(包括數(shù)據(jù)模型、測(cè)試范圍、預(yù)處理方式等等)。下圖是大普微X2900P的SSS PTS測(cè)試信息:

SSS PTS測(cè)試的內(nèi)容包括512字節(jié)、4K、8K、16K、32K、64K、128K和1MB塊大小,在0/100、5/95、35/65、50/50、65/35、95/5和100/0混合讀寫比例下的穩(wěn)定態(tài)IOPS,并以數(shù)據(jù)表格、2D和3D圖示三種形式進(jìn)行展現(xiàn)。
首先是傲騰P5800X 800GB的成績(jī):



然后是大普微X2900P 800GB的成績(jī):



傲騰5800X使用的3D XPoint閃存能夠支持字節(jié)尋址,所以512b塊的穩(wěn)定態(tài)隨機(jī)讀寫性能優(yōu)勢(shì)明顯。大普微X2900P使用的鎧俠XL-FLASH使用4KB Page并針對(duì)低延遲進(jìn)行了大量?jī)?yōu)化,充分挖掘了3D NAND閃存的潛力,面對(duì)3D XPoint這樣的強(qiáng)敵,依然能夠在穩(wěn)定態(tài)4K隨機(jī)寫入性能上取得領(lǐng)先。
03
VDBench測(cè)試
VDBench是甲骨文推出的存儲(chǔ)性能評(píng)估工具,能夠支持去重和壓縮等特性。我們參考PURE STORAGE的數(shù)據(jù)模型制作了模擬Oracle數(shù)據(jù)庫、SQL數(shù)據(jù)庫、VDI桌面虛擬化三種企業(yè)級(jí)應(yīng)用負(fù)載的測(cè)試腳本,并將IOPS和延遲的關(guān)系制表。圖中橫軸為IOPS(越高越好),縱軸為對(duì)應(yīng)的延遲(越低越好)。



通過對(duì)比不難看出,傲騰P5800X和大普微X2900P這兩款SCM存儲(chǔ)級(jí)內(nèi)存產(chǎn)品的表現(xiàn)已經(jīng)遠(yuǎn)遠(yuǎn)超過了使用3D TLC閃存的企業(yè)級(jí)SSD,在嚴(yán)苛重負(fù)載應(yīng)用環(huán)境下能夠提供更加出色的存儲(chǔ)性能表現(xiàn)。
通過測(cè)試可以看到,大普微X2900P已經(jīng)具備接班傲騰的能力。作為傲騰停產(chǎn)后的替代者,大普微X2900P使用自研的DPU600主控搭配鎧俠XL-FLASH,展示出普通TLC閃存企業(yè)級(jí)SSD無法企及的強(qiáng)悍實(shí)力,能夠?yàn)閿?shù)據(jù)緩存與加速、AI訓(xùn)練、大數(shù)據(jù)分析等業(yè)務(wù)場(chǎng)景中提供堅(jiān)實(shí)助力,有力提升數(shù)據(jù)中心在寫入密集型應(yīng)用中的整體性能水平。