近日,IBM在Hot Chips2024大會上公布了即將推出的IBM Telum® II處理器和IBMSpyre™加速器的架構(gòu)細(xì)節(jié)。這些新技術(shù)旨在大幅擴(kuò)展下一代IBMZ大型主機(jī)系統(tǒng)的處理能力,通過新的AI集成方法,加速企業(yè)對傳統(tǒng)AI模型和大語言AI模型的協(xié)同使用。
此次IBM發(fā)布的主要?jiǎng)?chuàng)新技術(shù)包括IBM Telum II處理器、IO加速單元、IBM Spyre加速器。Telum II處理器和IBM Spyre加速器將由三星晶圓代工(Samsung Foundry)生產(chǎn),采用其高性能、高能效的5納米工藝節(jié)點(diǎn)。
具體來看,Telum II處理器配備八個(gè)運(yùn)行頻率達(dá)5.5GHz的高性能內(nèi)核,每個(gè)內(nèi)核配備36MB二級高速緩存,片上高速緩存容量增加40%(總?cè)萘窟_(dá)360MB)。每個(gè)處理器抽屜的虛擬L4高速緩存為2.88GB,相比上一代增加40%。集成的AI加速器可實(shí)現(xiàn)低延遲、高吞吐量的交易中AI推理,例如增強(qiáng)金融交易期間的欺詐檢測,并且每塊芯片的計(jì)算能力是上一代的四倍。TelumII芯片中集成了最新的I/O加速單元DPU。在設(shè)計(jì)上,其I/O密度提高50%,可大幅提高數(shù)據(jù)處理能力,進(jìn)一步提高IBMZ的整體效率和可擴(kuò)展性。
Spyre加速器是一款專為復(fù)雜AI模型和生成式AI用例提供可擴(kuò)展功能的企業(yè)級加速器。它有高達(dá)1TB的內(nèi)存,可在普通IO抽屜的八塊卡上串聯(lián)工作,以支持大型主機(jī)的整體AI工作負(fù)載,同時(shí)每塊卡的功耗不超過75W。每塊芯片由32個(gè)計(jì)算內(nèi)核組成,支持int4、int8、fp8和fp16數(shù)據(jù)類型,適用于低延遲和高吞吐量的AI應(yīng)用。
IBM主機(jī)和Linux ONE產(chǎn)品管理副總裁Tina Tarquinio表示,TelumII處理器和Spyre加速器旨在提供安全、節(jié)能、高性能的企業(yè)計(jì)算解決方案。這些多年研發(fā)的創(chuàng)新成果將被引入下一代IBMZ平臺,幫助客戶大規(guī)模利用大語言模型和生成式AI技術(shù)。
據(jù)IBM指出,作為IBM下一代IBM Z和IBM Linux ONE平臺的中央處理器,Telum II處理器預(yù)計(jì)在2025年向IBM Z和Linux ONE客戶提供。IBM Spyre加速器仍在技術(shù)預(yù)覽階段,預(yù)計(jì)也將于2025年推出。
根據(jù)摩根士丹利最近發(fā)布的一份研究報(bào)告預(yù)測,在未來幾年,生成式AI的電力需求將以每年75%的速度激增,其2026年的能耗或?qū)⑴c西班牙2022年的全年能耗相當(dāng)。業(yè)界人士認(rèn)為,支持適當(dāng)規(guī)模的基礎(chǔ)模型和針對AI工作負(fù)載的混合架構(gòu)越來越重要。
封面圖片來源:拍信網(wǎng)