在全球半導(dǎo)體行業(yè)中,Cerebras Systems 最近創(chuàng)下新的里程碑,推出了世界上尺寸最大的AI芯片──WSE(Wafer Scale Engine),并在AI推理速度上超越了英偉達。 這款芯片的尺寸是8.5英寸(約22公分)的巨大方形芯片,擁有驚人的40億個晶體管,這使得它在AI推理運算中達到每秒2,522個token,比NVIDIA叢集(Cluster)快了約2.5倍。 Cerebras的信息安全官Naor Penso在溫哥華的Web Summit大會中表示,這是全球最快的推理速度。
推理速度對于企業(yè)客戶來說至關(guān)重要,尤其是在需要實時反應(yīng)的情境中,例如在購物車中添加AI引擎,以便快速提供食譜建議。 隨著AI技術(shù)的進步,推理速度的需求將變得更加迫切,因為未來的AI代理將需要處理更復(fù)雜的多步驟任務(wù)。
WSE芯片的設(shè)計不僅依賴晶體管的數(shù)量,還包括將所有零件整合在一個芯片上,并配備44GB的高速RAM。 這種設(shè)計使得Cerebras的芯片在性能上優(yōu)于NVIDIA的Blackwell芯片,Cerebras每秒可達2,522個token,而NVIDIA Blackwell為1,038個token。 「我們測試過數(shù)十家廠商,Cerebras是唯一在Meta主要模型上能超越Blackwell的推論解決方案?!笰rtificial Analysis執(zhí)行長Micah Hill-Smith說。
WSE芯片可說是電腦芯片設(shè)計的一個有趣進化,這不僅是對傳統(tǒng)CPU和GPU架構(gòu)的挑戰(zhàn),更是對AI計算需求的全新解決方案。 Cerebras的營銷官Julie Shin強調(diào),這不是一項漸進式技術(shù),而是芯片技術(shù)的一次飛躍。