在2025年12月2日的AWS re:Invent大會(huì)上,亞馬遜云端服務(wù)(AWS)正式推出其最新一代AI芯片Trainium3。Trainium3是AWS首款采用3納米制程技術(shù)的AI芯片,專為訓(xùn)練與服務(wù)下一代生成式AI、推理、多模態(tài)與視頻生成等應(yīng)用而設(shè)計(jì)。
根據(jù)AWS官方資料,Trainium3芯片單顆提供高達(dá)2.52 petaflops(PFLOPs)的FP8運(yùn)算效能,內(nèi)存容量提升1.5倍、頻寬提升1.7倍,達(dá)到144 GB HBM3e內(nèi)存與4.9 TB/s內(nèi)存頻寬。Trainium3 UltraServer系統(tǒng)整合最多144顆Trainium3芯片,單一系統(tǒng)可提供最高20.7 TB HBM3e內(nèi)存、706 TB/s內(nèi)存頻寬與362 PFLOPs FP8運(yùn)算效能,相較于前一代Trainium2 UltraServer,運(yùn)算效能提升4.4倍、內(nèi)存頻寬提升3.9倍,能效提升超過4倍。
Trainium3支持先進(jìn)數(shù)據(jù)格式(如MXFP8與MXFP4),并針對(duì)密集與專家平行(expert-parallel)工作負(fù)載進(jìn)行優(yōu)化,適合強(qiáng)化學(xué)習(xí)、Mixture-of-Experts(MoE)、推理與長上下文架構(gòu)等應(yīng)用。AWS同時(shí)擴(kuò)展Neuron開發(fā)框架,支持原生PyTorch與開源組件,讓開發(fā)者能更輕松地在Trainium3上部署與優(yōu)化AI模型。
此外,AWS也宣布Trainium2芯片已全面供不應(yīng)求,Trainium業(yè)務(wù)已成長為數(shù)十億美元規(guī)模,并在2025年第三季成長150%。Trainium3將擴(kuò)大服務(wù)對(duì)象,從原本少數(shù)大型客戶擴(kuò)展至更多企業(yè)用戶。
在模型方面,AWS同步推出Nova 2系列第二代自研模型,包含Lite、Pro、Sonic與Omni四款新模型,進(jìn)一步提升推理與多模態(tài)處理效能,支持更復(fù)雜的AI應(yīng)用場景。