谷歌母公司Alphabet于11月6日宣布,其第七代自研人工智能推理芯片TPU Ironwood將在未來數(shù)周內(nèi)全面開放給企業(yè)與開發(fā)者使用。這款芯片最早在今年4月亮相,經(jīng)過測試后,現(xiàn)已進入逐步部署階段。谷歌表示,Ironwood專為處理AI推理任務(wù)而設(shè)計,能夠支持大型語言模型的推理、復(fù)雜的生成式AI以及高吞吐量的實時推理等任務(wù)。
根據(jù)谷歌云AI與基礎(chǔ)設(shè)施負責人Amin Vahdat和計算平臺負責人Mark Lohmeyer的介紹,Ironwood的峰值性能較前代TPU v5p提升了10倍,而在推理場景中,其單芯片性能效率較TPU v6e(Trillium)提升超過4倍,成為谷歌迄今為止“最強大、最節(jié)能的定制芯片”。此外,Ironwood支持最多9,216顆芯片互聯(lián)組成超級算力集群(superpod),顯著提升數(shù)據(jù)吞吐量與推理速度,幫助企業(yè)突破大模型推理時的帶寬與延遲瓶頸。
在實際應(yīng)用方面,AI大模型公司Anthropic計劃使用多達100萬顆Ironwood TPU來支撐其下一代模型的推理需求。Anthropic目前同時獲得谷歌與亞馬遜的投資,被視為谷歌芯片戰(zhàn)略落地效果的重要合作伙伴。
與此同時,谷歌還宣布擴展自研Arm架構(gòu)CPU產(chǎn)品線Axion,并推出多款面向云計算市場的新實例。其中,N4A虛擬機已進入預(yù)覽階段,谷歌稱其價格性能比同類x86虛擬機提升兩倍;另一款C4A裸金屬服務(wù)器也將很快進入預(yù)覽,主要用于Android開發(fā)、車載系統(tǒng)、嚴格授權(quán)軟件、高密度測試及復(fù)雜模擬等專業(yè)場景。