剛結(jié)束的2021年架構(gòu)日,處理器龍頭英特爾公布全新獨(dú)立顯卡架構(gòu)Xe-HPG。新架構(gòu)首批GPU將采用臺積電N6制程,2022年第一季上市。這也是英特爾1998年發(fā)表i740以來,20多年后再次踏入獨(dú)立GPU市場。由于英特爾加入,獨(dú)立GPU市場再次形成三國鼎立局面,圖形、圖像到AI和高性能計算,技術(shù)競爭和市場爭奪將全面升級。
近期GPU市場行情看漲,研究公司Jon Peddie Research報告顯示,2021年第一季度全球GPU出貨量達(dá)1.19億顆,較2020年同期成長38.78%。英特爾整體GPU出貨達(dá)68%市占率,但獨(dú)立GPU方面,英偉達(dá)仍以81%市占率遙遙領(lǐng)先,AMD以19%市占率排名第二。Jon Peddie Research預(yù)期,獨(dú)立GPU出貨量還將繼續(xù)攀升,到2025年將占整體GPU市場26%。
因獨(dú)立GPU用途廣泛,成為大芯片市場應(yīng)用佼佼者,架構(gòu)和制程技術(shù)都達(dá)產(chǎn)業(yè)頂峰。英偉達(dá)2020年消費(fèi)市場旗艦級GeForce RTX30系列GPU,采用三星8納米制程,RTX3080和RTX3090包含的晶體管數(shù)目達(dá)280億個。競爭對手AMD RX6000系列采用臺積電7納米制程,晶體管數(shù)目也達(dá)268億個。
因頂尖制程和龐大晶體管數(shù)目是因應(yīng)越來越復(fù)雜的芯片架構(gòu)。以英偉達(dá)安培(Ampere)架構(gòu)為例,運(yùn)算部分包括串流處理器(Stream Processor,SP)、紋理映射單元(Texture mapping unit,TMU)、深度學(xué)習(xí)單元(Tensor Core)、光線追蹤單元(RT Cores)、光柵化處理單元(ROPs)等。GPU帶入AI領(lǐng)域的是深度學(xué)習(xí)單元,用于實(shí)時深度學(xué)習(xí)、大型矩陣運(yùn)算和深度學(xué)習(xí)超級采樣等作業(yè),將GPU性能和作用完全提升,從圖形處理器升級成計算處理器。
為了追求性能,獨(dú)立GPU的競爭演化成架構(gòu)比拼。英偉達(dá)2020年推出安培架構(gòu),AMD回應(yīng)RDNA 2架構(gòu),RX6000性能可與RTX30一較高下。這次英特爾加入戰(zhàn)局也是有備而來,Xe架構(gòu)經(jīng)過多年發(fā)展,不但具備最流行的各種元素,還使用臺積電6納米制程,完全有實(shí)力與英偉達(dá)和AMD一較高下。仍有市場人士指出,英特爾還是基因?yàn)镃PU的企業(yè),GPU運(yùn)作仍需配合CPU。整體來說,處理好CPU和GPU的發(fā)展沖突,將是英特爾未來的挑戰(zhàn)。
時間回到2012年,多倫多大學(xué)創(chuàng)建能從100萬樣本自動學(xué)習(xí)識別圖像的Alex Net深度神經(jīng)網(wǎng)絡(luò),僅用兩個NVIDIA GTX580 GPU訓(xùn)練數(shù)天,就贏得當(dāng)年Image Net競賽,擊敗磨練幾十年的人類專家算法。業(yè)界認(rèn)識深度學(xué)習(xí)的強(qiáng)大后,斯坦福大學(xué)就與英偉達(dá)研究室合作開發(fā)使用大規(guī)模GPU計算系統(tǒng)訓(xùn)練網(wǎng)絡(luò)的方法,從此揭開深度神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,一舉奠定GPU在AI領(lǐng)域的地位。
GPU能用于人工智能與深度學(xué)習(xí),因提供多個平行運(yùn)算基礎(chǔ)結(jié)構(gòu),且核心數(shù)較多,可平行運(yùn)算大量數(shù)據(jù),還擁有快速儲存速度和高浮點(diǎn)運(yùn)算能力,使GPU完美契合AI計算需求,GPU仍是AI訓(xùn)練階段較適合的芯片。據(jù)統(tǒng)計,GPU在AI時代的云端訓(xùn)練芯片仍占高達(dá)64%。雖然隨著FPGA及ASIC技術(shù)突破,GPU市占率有些下降,仍是云端訓(xùn)練市場占比最大的芯片種類,2019~2021年年復(fù)合成長率達(dá)40%。
憑著GPU在數(shù)據(jù)中心的優(yōu)異表現(xiàn),英偉達(dá)業(yè)績也一路走高。今年第一季數(shù)據(jù)中心業(yè)務(wù)營收達(dá)20.5億美元,創(chuàng)歷史紀(jì)錄,與2020年同期相比成長達(dá)79%,與上一季相比也成長8%,占總營收比重36%。發(fā)展較晚的AMD也奮起直追,執(zhí)行長蘇姿豐說今年第二季數(shù)據(jù)中心GPU營收較2020年同期成長一倍多。有出色營收表現(xiàn)要?dú)w功于Instinct加速器部署增加,還有CDNA2架構(gòu)最新數(shù)據(jù)中心顯卡首次出貨。
英特爾最新數(shù)據(jù)中心GPU Ponte Vecchio日前發(fā)表,擁有1000億顆晶體管的SoC也創(chuàng)下英特爾紀(jì)錄。Ponte Vecchio采用Xe-HPC微架構(gòu),由多個復(fù)雜設(shè)計組成,以單元形式呈現(xiàn),然后嵌入式多芯片互連橋接單元單元組裝,達(dá)成單元低功耗、高速連接效能。設(shè)計均集成于Foveros封裝,為提高功率和互連密度形成有源芯片的3D堆棧。
市場人士表示,ASIC和FPGA都在與GPU競爭時,英特爾選擇發(fā)展GPU,說明GPU可能還是通用AI的最好選擇。這顆巨大芯片也可看作反擊英偉達(dá)數(shù)據(jù)中心CPU,雙方都建立CPU+GPU布局,準(zhǔn)備面對面對決。英特爾還在發(fā)展oneAPI計劃,成為英偉達(dá)CUDA的強(qiáng)大競爭對手,因范圍不僅限GPU,涵蓋CPU和所有處理器。
就英偉達(dá)、AMD、英特爾布局看來,盡管獨(dú)立GPU不能完全取代CPU,但成為數(shù)據(jù)中心非常關(guān)鍵的一環(huán)。全球三大芯片廠商都力攻此領(lǐng)域,GPU三國志未來可能連番上演。
封面圖片來源:拍信網(wǎng)