苦心磨一劍,今朝露鋒芒。全球IP龍頭企業(yè)Arm于9月15日召開線上技術(shù)媒體溝通會,宣布推出新一代Neoverse V2平臺,重新定義和變革全球的計算基礎(chǔ)設(shè)施。
Arm表示,基于Neoverse的平臺正通過市場領(lǐng)先的可擴(kuò)展效率,使Arm生態(tài)伙伴能在各個基礎(chǔ)設(shè)施領(lǐng)域自由創(chuàng)新,從而重新定義云計算的可能性。
據(jù)悉,在全球范圍內(nèi),Arm現(xiàn)已被用于各個主要公有云,包括AWS、微軟、谷歌、阿里巴巴、甲骨文等科技巨頭。這意味著,世界各地的每一位開發(fā)者現(xiàn)在都可獲取Arm Neoverse。
在這條Neoverse研發(fā)創(chuàng)新路上,Arm已步履多年,所謂厚積而薄發(fā)。2018年,Arm發(fā)布Arm Neoverse,為萬億聯(lián)網(wǎng)設(shè)備描繪了安全、高性能、靈活的從云到邊緣計算的愿景。
2019年2月,Arm公布Neoverse的技術(shù)細(xì)節(jié)和 Arm Neoverse平臺路線圖,打消了外界對公司愿景的所有疑慮。這一次,Arm推出了Neoverse N1平臺,其性能對比 Cortex-A72提升了60%,大大超出了在2018年定下30%的目標(biāo)。實際上,部分工作負(fù)載的性能提升幅度甚至更高。之后,Arm Neoverse合作陣營日漸壯大,諸如亞馬遜、富士通(Fujitsu)、賽靈思(Xilinx)、恩智浦(NXP)等公司紛紛加入Arm Neoverse生態(tài)。
2020年9月,Arm提出基于Neoverse平臺的E、N、V三大系列核心設(shè)計原則。其中,V系列在高性能計算、機(jī)器學(xué)習(xí)以及一些對性能優(yōu)先的高計算應(yīng)用上有非常大的優(yōu)勢;N系列是一個平衡PPA的設(shè)計,在性能、功耗、面積之間尋找平衡設(shè)計,適用于通用服務(wù)器的CPU芯片,智能網(wǎng)卡的應(yīng)用芯片,5G基站的網(wǎng)絡(luò)設(shè)備等;E系列專注于更高效的數(shù)據(jù)吞吐能力,對于網(wǎng)絡(luò)數(shù)據(jù)層處理器、低功耗網(wǎng)關(guān)的5G部署等應(yīng)用,優(yōu)勢明顯。
今年9月15日,Arm更新Arm Neoverse路線圖,推出Neoverse V2平臺(代號“Demeter”)。該平臺配備最新的V系列核心和產(chǎn)業(yè)廣泛部署的Arm CMN-700 mesh互連技術(shù),還將為云和HPC工作負(fù)載提供市場領(lǐng)先的整型性能,并引入若干Armv9架構(gòu)安全增強(qiáng)功能。毫無疑問,Arm的新產(chǎn)品將加強(qiáng)其在新一代基礎(chǔ)設(shè)施發(fā)展的地位。

從路線圖中看出,在整個基礎(chǔ)設(shè)施市場中,Arm一直在加速技術(shù)創(chuàng)新步伐。作為Arm持續(xù)投入于高效的性能和吞吐量的一部分,新一代N系列產(chǎn)品正在開發(fā)中,并將于2023年推出。與N2的市場領(lǐng)先效率相比,新一代N系列CPU將在性能和效率方面實現(xiàn)代際提升。針對N2在市場的表現(xiàn),Arm表示,目前有近20家合作伙伴正基于該平臺進(jìn)行設(shè)計,市場反應(yīng)相當(dāng)積極正面。其中,國內(nèi)的初創(chuàng)企業(yè)包括遇賢微電子、鴻鈞微電子和云豹智能也正基于Neoverse N2進(jìn)行芯片設(shè)計開發(fā)。
而E系列內(nèi)核可以非常有效地作為數(shù)據(jù)平面處理器使用,支持高吞吐量的SoC和5G及網(wǎng)絡(luò)。Arm透露,下一次將分享E系列的更多進(jìn)展。
Neoverse平臺專為解決加速基礎(chǔ)設(shè)施解決方案的各類問題而設(shè)計,專用處理能力有助于降低工作負(fù)載功耗,并滿足現(xiàn)代工作負(fù)載更高的計算要求。
Arm Neoverse V2平臺可滿足大型互聯(lián)網(wǎng)和HPC客戶的需求,在不增加功耗和面積的情況下,進(jìn)一步推動云工作負(fù)載性能。對于云工作負(fù)載,最基本的需求是強(qiáng)大的整型性能,要具有良好的可擴(kuò)展性,并且對于云運(yùn)營商而言是高效的,而Arm Neoverse V2平臺將提供市場領(lǐng)先的整型性能。
除了整型可擴(kuò)展性能之外,現(xiàn)代云應(yīng)用程序還擁有大型工作數(shù)據(jù)集。為能在接近CPU的位置保留盡可能多的數(shù)據(jù),Arm在Neoverse V2中增加了2MB的專用L2緩存,比V1上的L2要大上一倍,且使用延遲的負(fù)載不變,能讓MySQL和Memcached等云應(yīng)用獲得顯著的性能提升。
對于像HPC快速遷移到云端的工作負(fù)載,矢量性能尤為重要,而ML是未來的關(guān)鍵云工作負(fù)載。在Neoverse V2上,Arm已經(jīng)完成了從SVE到SVE2的過渡,SVE2可幫助滿足更多非HPC ML類型的工作負(fù)載,同時添加了更多加密指令。Arm還將矢量引擎重構(gòu)為4通道的128位,并對微架構(gòu)進(jìn)行了調(diào)整,以提高其有效吞吐量。
在IO方面,通過V2平臺,合作方已經(jīng)能夠利用支持Neoverse N2的系統(tǒng)IP底板,包括CMN mesh、MMU、GIC和NI非一致性互連。Arm的CMN-700 mesh互連技術(shù),可支持每塊裸片最高512MB的系統(tǒng)級緩存,當(dāng)前基于CMN-700的設(shè)計中增加了每個核心的系統(tǒng)級緩存,從而提升了云原生工作負(fù)載性能。另外,Arm Neoverse V2還引入了一些關(guān)鍵的Armv9安全增強(qiáng)功能,主要目的是防御內(nèi)存攻擊??傮w而言,Arm認(rèn)為,在為云工作負(fù)載提供出色性能、可擴(kuò)展性和效率方面,Neoverse V2無疑具有領(lǐng)先優(yōu)勢。
目前,已經(jīng)有多家合作伙伴在Arm Neoverse V2的基礎(chǔ)上進(jìn)行設(shè)計,其中,NVIDIA正利用 Neoverse V2作為其Grace數(shù)據(jù)中心CPU的計算基礎(chǔ)。Grace將結(jié)合Neoverse V2的能效與LPDDR5X內(nèi)存的能效,帶來高出傳統(tǒng)架構(gòu)的服務(wù)器2倍的每瓦性能表現(xiàn)。
NVIDIA超大規(guī)模和HPC副總裁兼總經(jīng)理Ian Buck稱,“Grace基于Arm Neoverse V2核心打造,可提供多達(dá)72個核心,并與我們的GPU相結(jié)合以建立這些AI。我們有一個新的NVLink-C2C互連技術(shù),可將CPU與GPU結(jié)合起來,用于GPU和CPU之間的高性能和一致性通信。未來,Grace加上Hopper將建立其驚人的巨型AI,并解決未來的HPC問題。”
此外,針對從客戶體驗角度上看,Arm在基礎(chǔ)設(shè)施架構(gòu)上有哪些新目標(biāo)的問題,Arm基礎(chǔ)設(shè)施事業(yè)部產(chǎn)品解決方案副總裁Dermot O’Driscoll表示,“我們聆聽了合作伙伴的需求,他們十分關(guān)注性能。但隨著數(shù)據(jù)量爆發(fā)式增長,他們需要更有效的解決方案,而且是比傳統(tǒng)架構(gòu)來得更有效的解決方案。這將使他們能夠擁有具備多核心數(shù)的多芯片解決方案,以及針對特定應(yīng)用的加速能力。這些都有助于提高效率。”
當(dāng)前,基礎(chǔ)設(shè)施市場正在被重新定義,Arm Neoverse具備的高性能、高能效的計算能力,以及Arm生態(tài)系統(tǒng)所提供的專用處理和工作負(fù)載加速能力,將加固未來基礎(chǔ)設(shè)施的創(chuàng)新技術(shù)支撐。
封面圖片來源:拍信網(wǎng)