據(jù)InfoWorld網(wǎng)站報(bào)道,目前,用于機(jī)器學(xué)習(xí)應(yīng)用的顯卡市場(chǎng)基本上是一家公司的天下:英偉達(dá)。
AMD是另外一家主流獨(dú)立顯卡廠商,市場(chǎng)份額達(dá)到30%,英偉達(dá)市場(chǎng)份額為70%。在機(jī)器學(xué)習(xí)領(lǐng)域,英偉達(dá)的領(lǐng)先優(yōu)勢(shì)可以用一個(gè)詞來(lái)描述:一家獨(dú)大。原因不僅僅是英偉達(dá)產(chǎn)品在所有支持顯卡的云服務(wù)中占有壓倒性優(yōu)勢(shì),應(yīng)用在機(jī)器學(xué)習(xí)中的顯卡中間件大體上都是英偉達(dá)的CUDA(統(tǒng)一計(jì)算設(shè)備架構(gòu))。
AMD很早就制定了反擊計(jì)劃。除一直在開(kāi)發(fā)在價(jià)格和性能上能與英偉達(dá)競(jìng)爭(zhēng)的硬件產(chǎn)品外,它還在打造一個(gè)與廠商無(wú)關(guān)的顯卡編程資源平臺(tái),使開(kāi)發(fā)者在開(kāi)發(fā)采用顯卡的解決方案時(shí)能自由地選擇AMD技術(shù),而無(wú)需擔(dān)憂軟件支持。
AMD最近公布了實(shí)現(xiàn)這些目標(biāo)的新措施。首先是一款新顯卡產(chǎn)品——Radeon Vega(基于之前公布的新顯卡架構(gòu));其次是新版開(kāi)放源代碼軟件平臺(tái)ROCm——使機(jī)器學(xué)習(xí)框架和其他應(yīng)用能利用多種顯卡的軟件層。
這兩個(gè)元素——硬件和軟件,同等重要。對(duì)于AMD反擊英偉達(dá)在機(jī)器學(xué)習(xí)領(lǐng)域的優(yōu)勢(shì)來(lái)說(shuō),兩者缺一不可。
AMD新一代明星顯卡:Vega
長(zhǎng)期以來(lái),AMD一直致力于提供性價(jià)比最高的產(chǎn)品,無(wú)論是處理器還是顯卡(或長(zhǎng)期以來(lái)傳言中的二合一產(chǎn)品)。Vega——AMD的新一代顯卡,目標(biāo)不是成為英偉達(dá)Pascal系列顯卡的高性價(jià)比替代品,而是完全擊敗Pascal。
InfoWorld 表示,AMD披露的早期跑分顯示,Radeon Vega Frontier Edition顯卡(一款專業(yè)級(jí)Vega顯卡),在DeepBench中的跑分是英偉達(dá)Tesla P100顯卡的1.38-1.51倍——與使用的英偉達(dá)驅(qū)動(dòng)程序版本有關(guān)。
盡管跑分這種事兒不必過(guò)于認(rèn)真,但如此大幅度的性能差距仍然給人留下深刻印象。重要的還有AMD產(chǎn)品的價(jià)格。Tesla P100零售價(jià)約為1.3萬(wàn)美元(約合人民幣8.9萬(wàn)元),AMD尚未披露Vega Frontier價(jià)格。即使Vega Frontier價(jià)位與Tesla P100相當(dāng),它也還是很有吸引力的,符合AMD的總體商業(yè)策略。
AMD應(yīng)對(duì)CUDA的技術(shù):ROCm
對(duì)于AMD在機(jī)器學(xué)習(xí)領(lǐng)域獲得優(yōu)勢(shì)更重要的不是在價(jià)格上擊敗英偉達(dá),而是確保其硬件在常見(jiàn)機(jī)器學(xué)習(xí)應(yīng)用中得到與英偉達(dá)至少同等程度的支持。
大體上,利用顯卡進(jìn)行加速的軟件,都使用英偉達(dá)的CUDA庫(kù)文件——只支持英偉達(dá)硬件。開(kāi)放源代碼的OpenCL庫(kù),在多種類型設(shè)備上提供與廠商無(wú)關(guān)的支持,但性能不如CUDA等專用解決方案。
AMD沒(méi)有努力改進(jìn)OpenCL,使之可以與CUDA媲美——這是一個(gè)由委員會(huì)推動(dòng)的緩慢過(guò)程,而是打造自己的開(kāi)放源代碼顯卡計(jì)算平臺(tái)ROCm(Radeon開(kāi)放計(jì)算平臺(tái))。AMD的理念是,ROCm為顯卡——主要是AMD自家顯卡,提供了一個(gè)與語(yǔ)言和硬件無(wú)關(guān)的中間件層,從理論上說(shuō)適用于任何顯卡。如果有需要,ROCm還可以通過(guò)OpenCL與顯卡通訊,但也提供有直接與底層硬件通訊的渠道。
InfoWorld稱,與OpenCL相比,ROCm能大幅提升機(jī)器學(xué)習(xí)應(yīng)用的性能,這一點(diǎn)是毋庸置疑的。把Caffe框架移植到ROCm,速度比OpenCL版提升了約80%。另外,AMD還宣稱,移植代碼利用ROCm是一個(gè)高度自動(dòng)化的過(guò)程,這是現(xiàn)有框架嘗試ROCm的又一個(gè)“誘因”。對(duì)其他框架的支持——例如TensorFlow和MxNet,也在規(guī)劃中。
AMD著眼于長(zhǎng)遠(yuǎn)考慮
AMD心目中的最終目標(biāo)并不復(fù)雜:創(chuàng)建一個(gè)環(huán)境,使其顯卡在機(jī)器學(xué)習(xí)領(lǐng)域能替代英偉達(dá)產(chǎn)品。AMD可以通過(guò)以相當(dāng)?shù)膬r(jià)格提供性能相當(dāng)甚至更高的硬件,確保現(xiàn)有的機(jī)器學(xué)習(xí)軟件生態(tài)鏈能在其顯卡上運(yùn)行來(lái)實(shí)現(xiàn)其目標(biāo)。
在某種程度上,移植軟件是最簡(jiǎn)單的部分。移植軟件基本上就是聘請(qǐng)足夠多的編程人員,為最重要的開(kāi)放源代碼機(jī)器學(xué)習(xí)框架改寫(xiě)需要的代碼,然后隨著硬件和框架不斷發(fā)展而更新代碼。
對(duì)于AMD來(lái)說(shuō)最困難的工作,可能是在大規(guī)模提供顯卡的應(yīng)用中取得立足之地。Amazon Web Services、Azure和Google Cloud Platform中的顯卡都是英偉達(dá)產(chǎn)品。需求尚不支持其他顯卡。但是,如果新一代機(jī)器學(xué)習(xí)軟件更加獨(dú)立于顯卡,云服務(wù)提供商將失去一個(gè)不采用Vega或其后續(xù)產(chǎn)品的借口。
AMD引導(dǎo)其顯卡在機(jī)器學(xué)習(xí)領(lǐng)域需求的任何計(jì)劃都是大膽的。AMD要成功需要數(shù)年時(shí)間,因?yàn)樗鎸?duì)的是一個(gè)英偉達(dá)已經(jīng)稱霸多年的世界。
如需獲取更多資訊,請(qǐng)關(guān)注全球半導(dǎo)體觀察官網(wǎng)(www.0318hs.cn)或搜索微信公眾賬號(hào)(全球半導(dǎo)體觀察)。