本站5月17日消息,美國(guó)封殺華為芯片從某種程度來說,其實(shí)是對(duì)后者技術(shù)的認(rèn)可,而他們確實(shí)也有硬實(shí)力做支撐。
之前華為推出了AI算力集群解決方案CloudMatrix 384,雖然外行看起來沒有什么厲害的,但國(guó)外投行直言,這領(lǐng)先于英偉達(dá)和AMD目前市場(chǎng)上的產(chǎn)品一代。
按照華為的說法,CloudMatrix 384基于384顆昇騰芯片構(gòu)建,通過全互連拓?fù)浼軜?gòu)實(shí)現(xiàn)芯片間高效協(xié)同,可提供高達(dá)300 PFLOPs的密集BF16算力,接近達(dá)到英偉達(dá)GB200 NVL72系統(tǒng)的兩倍。
此外,CM384在內(nèi)存容量和帶寬方面同樣占據(jù)優(yōu)勢(shì),總內(nèi)存容量超出英偉達(dá)方案3.6倍,內(nèi)存帶寬也達(dá)到2.1倍,為大規(guī)模AI訓(xùn)練和推理提供了更高效的硬件支持。
盡管單顆昇騰芯片性能約為英偉達(dá)Blackwell架構(gòu)GPU的三分之一,但華為通過規(guī)?;到y(tǒng)設(shè)計(jì),成功實(shí)現(xiàn)整體算力躍升,并在超大規(guī)模模型訓(xùn)練、實(shí)時(shí)推理等場(chǎng)景中展現(xiàn)更強(qiáng)競(jìng)爭(zhēng)力。
在昨日的華為云AI峰會(huì)上,華為云副總裁黃瑾介紹了更多CloudMatrix 384超節(jié)點(diǎn)技術(shù)優(yōu)勢(shì)與細(xì)節(jié),其指出隨著大模型訓(xùn)練和推理對(duì)算力需求的爆炸式增長(zhǎng),傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷,超節(jié)點(diǎn)架構(gòu)的誕生不僅是技術(shù)的突破,更是以工程化創(chuàng)新開辟AI產(chǎn)業(yè)的新路徑。
當(dāng)前,大模型訓(xùn)練經(jīng)歷了從早期小模型在單卡訓(xùn)練、小參數(shù)大模型在單機(jī)訓(xùn)練,到現(xiàn)在MoE、長(zhǎng)序列、多模態(tài)大模型都在AI集群上訓(xùn)練的演進(jìn)過程。
AI算力的瓶頸,從單卡算力的瓶頸到單機(jī)內(nèi)總線帶寬的瓶頸,再到現(xiàn)在集群間通信帶寬的瓶頸,需求增長(zhǎng)了1萬(wàn)倍。
然而過去的8年里,單卡硬件的算力增長(zhǎng)了40倍,但是節(jié)點(diǎn)內(nèi)的總線帶寬只增長(zhǎng)了9倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長(zhǎng)了4倍,這使得集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn)。
黃瑾表示,面對(duì)這些挑戰(zhàn),華為云推出了采用全對(duì)等互聯(lián)架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)。這項(xiàng)技術(shù)創(chuàng)新跳出單點(diǎn)技術(shù)限制走向系統(tǒng)性、工程性的創(chuàng)新算力架構(gòu),直面通信效率瓶頸、內(nèi)存墻制約、可靠性短板三大技術(shù)挑戰(zhàn)。通過新型高速互聯(lián)總線實(shí)現(xiàn)384張卡互聯(lián)成為一個(gè)超級(jí)云服務(wù)器,最高提供300Pflops的算力規(guī)模,比業(yè)界同類產(chǎn)品領(lǐng)先67%。
目前,基于CloudMatrix的超節(jié)點(diǎn)集群已經(jīng)在蕪湖、貴安、內(nèi)蒙規(guī)模上線,而華為云超節(jié)點(diǎn)創(chuàng)新系統(tǒng)架構(gòu)的背后,是華為云堅(jiān)持“昇騰云服務(wù)支持百模千態(tài),盤古大模型重塑千行萬(wàn)業(yè)”的戰(zhàn)略。
“一直以來華為云持續(xù)推動(dòng)昇騰AI云服務(wù)全面升級(jí),通過打磨昇騰云的訓(xùn)練、推理的性能、可靠性和性價(jià)比,為中國(guó)乃至全球客戶提供好用、易用的AI算力云服務(wù)?,F(xiàn)已全面適配了DeepSeek在內(nèi)的160多個(gè)大模型,以云服務(wù)的方式,協(xié)助客戶進(jìn)行模型的開發(fā),訓(xùn)練,托管和應(yīng)用?!?/p>
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。