9月14日,SK海力士宣布與英特爾公司(Intel)共同發(fā)布白皮書,該白皮書證實,SK海力士DDR5服務器DRAM搭載英特爾CPU,其性能達到了行業(yè)領先水平。該白皮書在SK海力士和英特爾官方網(wǎng)站同時發(fā)布。
自DDR5 DRAM研發(fā)階段,兩家公司就開展了緊密合作。白皮書介紹了在過去8個月中,第四代英特爾®至強®可擴展處理器1 (4th Gen Intel® Xeon® Scalable Processor,以下簡稱第四代至強處理器)搭載DDR5 DRAM進行性能驗證所得出的結果。
近年來,服務器行業(yè)對低功耗、高性能半導體的需求日益增長。白皮書中強調(diào),此次兩家公司將通過提供性能及能源效率均為行業(yè)領先水平的存儲器和CPU,攜手開啟一個推動數(shù)據(jù)中心進化的新時代。

白皮書指出,英特爾第四代至強處理器的性能較第三代提高了2.9倍2。同時,SK海力士DDR5 DRAM的功耗較DDR4 DRAM降低14.4%。特別是在功耗與性能的比率(效能功耗比)3上,在適用第四代至強處理器的服務器中DDR5與DDR4相比,其整數(shù)計算(Integer)和浮點運算(Floating Point)4方面分別高出1.22倍和1.11倍。
因此,兩家公司預測,如果服務器客戶未來利用第四代至強處理器和DDR5搭建數(shù)據(jù)中心,將有助于改善能源效率,構建可持續(xù)的數(shù)據(jù)中心。此外,通過高效運營數(shù)據(jù)中心,客戶總體擁有成本(TCO)5也會有所降低。

SK海力士DRAM商品企劃擔當副社長柳成洙表示,“如白皮書中所展示,使用搭載英特爾CPU和SK海力士DDR5 DRAM的服務器,相較上一代產(chǎn)品,數(shù)據(jù)處理速度更快,功耗更低。特別是在生成式人工智能(Generative AI)等應用中,可以有效運用需要處理海量數(shù)據(jù)的高密度的DRAM。”
柳副社長還補充道:“期待我們的服務器芯片客戶能夠從白皮書提供的重要數(shù)據(jù)中受益,有效幫助其業(yè)務發(fā)展。”
英特爾內(nèi)存與IO技術副總裁Dimitrios Ziakas博士表示:“英特爾一直與SK海力士及行業(yè)的其他廠商保持合作,以通過第四代英特爾®至強®可擴展處理器實現(xiàn)DDR5的最佳運行環(huán)境與性能表現(xiàn)。這些努力都是為了提供強大的、兼?zhèn)渥吭叫阅芎湍苄У臄?shù)據(jù)中心系統(tǒng)解決方案,使我們的共同客戶受益”。
SK海力士計劃通過與英特爾最新的合作項目,繼續(xù)加強服務器市場的產(chǎn)品布局。根據(jù)預測,下半年市場對DRAM需求將會增長,公司計劃以第四代(1a)及第五代(1b)DDR5 DRAM為主力產(chǎn)品加強市場領先競爭力,并加速改善業(yè)績。
白皮書包含了服務器客戶在使用DDR5產(chǎn)品時可以參考的詳細測試數(shù)據(jù),主要內(nèi)容涵蓋了第四代至強處理器與DDR5存儲器結合時所體現(xiàn)的速度、性能、功耗等。

圖1: SK海力士DDR4和DDR5的服務器帶寬對比
首先,同在3,200Mbps的傳輸速率下,DDR5相較于DDR4,其服務器帶寬(Server Bandwidth8)增加了20%。實際上,DDR5在4,800Mbps傳輸速率下的服務器帶寬,比DDR4最高速率3,200Mbps的服務器帶寬提高了70%9。這是DDR5改進設計結構的結果,與DDR4相比,它最大限度地減少了內(nèi)部傳輸延遲并允許更高的傳輸速度,擴大了服務器的整體帶寬。

圖2: SK海力士DDR4和DDR5的傳輸速度和功耗對比
此外,本項研究中,SK海力士還證實了DDR5的功耗較DDR4減少14.4%。在此過程中,HKMG(High-K Metal Gate)等新技術發(fā)揮了重要作用。HKMG是在DRAM晶體管內(nèi)的絕緣膜上采用高K柵電介質(zhì),在防止漏電的同時還可以改善電容(Capacitance)的新一代工藝。采用該工藝的存儲器具備更高的功耗效率。
研究結果表明第四代至強處理器的內(nèi)置加速器表現(xiàn)也較為出色。與上一代處理器相比,企業(yè)使用該內(nèi)置加速器處理目標工作負載時,每瓦(watt)性能效率可提高2.9倍。通過這些技術的綜合應用,第四代至強處理器和DDR5實現(xiàn)了將服務器帶寬提高50%,同時功耗減少14.4%的優(yōu)異效能功耗比。
通過發(fā)布白皮書,可以確認第四代至強處理器和DDR5組合系統(tǒng)下的運算性能,兩家公司利用系統(tǒng)測試工具“SPEC CPU 2017”對此進行了性能比較。
結果顯示,與上一代系統(tǒng)相比,整數(shù)計算和浮點運算分別改善了1.59倍和1.43倍。單位功耗下的系統(tǒng)性能也表現(xiàn)十分出色,在整數(shù)計算和浮點運算中分別提升了1.22倍和1.11倍。
在內(nèi)存延遲及速率測試工具“Intel MLC(Intel Memory Latency Checker)”的驗證下,系統(tǒng)性能也同樣突出,跟上一代相比,讀取性能和寫入性能分別提升1.4倍和1.51倍。
備注
“英特爾”、“英特爾logo”或其它“英特爾標志”等商標權均歸英特爾公司或其子公司所有。
1.第四代英特爾®至強®可擴展處理器(Intel® Xeon® Scalable Processor):是英特爾新一代服務器,用CPU支持PCIe Gen5及新一代DDR5內(nèi)存標準。
2.相較于上一代英特爾®至強®可擴展處理器,在同等工作量下,搭載嵌入式加速器,其效能功耗比率提升了2.9倍。
新配置:1-節(jié)點,2個預生產(chǎn)的第四代英特爾®至強®可擴展處理器(60核),含英特爾®存內(nèi)分析加速器(英特爾®IAA),基于預生產(chǎn)的英特爾平臺和軟件,啟用超線程,啟用睿頻,總內(nèi)存1024GB,(16x64GB DDR5 4800), 微代碼 0x2b0000a1,1×3.84TB P5510 NVMe,英特爾®以太網(wǎng)控制器X540-AT2, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic, QPL v0.2.1,accel-config-v3.4.6.4, ZSTD v1.5.2, RocksDB v6.4.6 (db_?bench), 英特爾于2022年11月進行測試。基準:1-節(jié)點,2個第三代英特爾®至強®可擴展處理器(40核)搭載超微SYS-220U-TNR,啟用超線程,啟用睿頻,關閉SNC,總內(nèi)存1024GB (16x64GB DDR4 3200),微代碼0xd000375, 1×3.84TB P5510 NVMe,英特爾®以太網(wǎng)控制器X540-AT2, Ubuntu 22.04.1 LTS, 5.18.12-051812-generic, ZSTD v1.5.2, RocksDB v6.4.6 (db_?bench), 英特爾于2022年11月進行測試。
3.效能功耗比 (Performance per watt):每一定單位功率每秒可處理的數(shù)據(jù)容量指標。
4.浮點運算(Floating Point):浮點數(shù)表示法是與定點小數(shù)法相對的概念,它通過改變小數(shù)點的位置來區(qū)分整數(shù)和小數(shù),并方便進行計算。例如,對于原始實數(shù)123.485,可以用1.23485×10^2或0.00123485×10^5等表示方式進行計算。
5.總體擁有成本(Total Cost of Ownership, TCO):包括初期投資、電力費、設施運營費、維護費等在內(nèi)的所有成本。
6.該數(shù)據(jù)由SK海力士在2022年12月運行的模擬實驗中得出。
7.基于SK海力士功耗計算器模擬計算得出的DDR4及DDR5產(chǎn)品功耗。
8.帶寬: 數(shù)據(jù)傳輸?shù)穆窂剑瑤挼脑黾右馕吨瑫r可以更有效地處理更多數(shù)據(jù)。
9.帶寬對比: 基于DDR4’s 3,200 Mbps的傳輸速率,與DDR5 3,200 Mbps 及 4,800 Mbps 傳輸速率的帶寬對比
封面圖片來源:拍信網(wǎng)