7月16日,黃仁勛在北京出席了“鏈博會(huì)”,罕見地以一身唐裝示人,并首次嘗試使用中文演講。
“中國(guó)的開發(fā)者、創(chuàng)業(yè)者正在推動(dòng)AI的快速創(chuàng)新,現(xiàn)在有100萬(wàn)名開發(fā)者投身這一領(lǐng)域,像DeepSeek、阿里巴巴、MiniMax、百度,他們開發(fā)的產(chǎn)品都是世界級(jí)的,推動(dòng)了全球人工智能的發(fā)展。”
自黃仁勛抵達(dá)北京以來(lái),對(duì)于中國(guó)AI產(chǎn)業(yè)及廠商的贊美,貫穿于每一次公開露面中。
這并不難理解,就在兩天前,這位英偉達(dá)掌舵人表示,美國(guó)政府已批準(zhǔn)此前被禁止出口的H20芯片,可以再度銷往中國(guó)。
鑒于國(guó)內(nèi)AI廠商的“算力焦慮”,那些已經(jīng)被英偉達(dá)在財(cái)報(bào)中列入“計(jì)減損失”的價(jià)值45億美元的庫(kù)存積壓,恐怕此刻正被緊急清點(diǎn)、打包,不日即可送到中國(guó)客戶手中。
不過,幾乎在黃仁勛高調(diào)示好中國(guó)市場(chǎng)的同一時(shí)間,美國(guó)商務(wù)部部長(zhǎng)霍華德·盧特尼克卻站出來(lái)擺了一道。
“中國(guó)企業(yè)無(wú)法得到最好的芯片,也不是第二好(second best),甚至不是第三好(even third best)”,在接受美媒采訪時(shí),盧特尼克直言不諱地表示,該策略是為了向中國(guó)企業(yè)出售足夠多的AI芯片,以形成對(duì)美國(guó)的技術(shù)依賴。
這番言論直白地闡述了一個(gè)立場(chǎng):在當(dāng)前對(duì)華半導(dǎo)體限制的基調(diào)下,無(wú)論政策是否松動(dòng),位于中國(guó)的下游產(chǎn)業(yè)鏈都無(wú)法取得符合預(yù)期的產(chǎn)品。
而此次到訪中國(guó)的黃仁勛,也并沒有用太多篇幅去渲染英偉達(dá)GPU的重要性,至少在中國(guó)市場(chǎng),英偉達(dá)的敘事,正在發(fā)生些微妙的轉(zhuǎn)變。
英偉達(dá),等不起
綜合多方信息來(lái)看,盧特尼克的表態(tài)很大程度上也是一種挽尊之舉。
一方面,中國(guó)通過稀土出口等反制手段開始取得效果;另一方面,自今年4月以來(lái),美國(guó)半導(dǎo)體產(chǎn)業(yè)鏈對(duì)于特朗普政府反復(fù)進(jìn)行游說(shuō)及施壓。
其中,英偉達(dá)的反應(yīng)尤為激烈,由于“特供版”H20芯片無(wú)法銷往他處,如果不解除禁售,將不得不面對(duì)真金白銀的損失。
在昨天下午的媒體溝通會(huì)上,黃仁勛也談到了關(guān)于H20的問題:“英偉達(dá)可能無(wú)法全部恢復(fù)先前的庫(kù)存計(jì)減損失,但大部分資產(chǎn)并未永久報(bào)廢,回收率可能達(dá)不到100%,但也不會(huì)是0。”
而相比于財(cái)報(bào)上的數(shù)字,真正讓黃仁勛擔(dān)心的應(yīng)該是英偉達(dá)GPU芯片留出的真空期。
可以橫向?qū)Ρ认拢^去三個(gè)月中國(guó)AI芯片行業(yè)發(fā)生了哪些變化。
以英偉達(dá)直接競(jìng)爭(zhēng)對(duì)手華為為例,今年5月華為在鯤鵬昇騰開發(fā)者大會(huì)上正式推出“CloudMatrix385超節(jié)點(diǎn)”算力平臺(tái),它基于384張昇騰芯片實(shí)現(xiàn)了業(yè)界最大規(guī)模的高速總線互聯(lián)。
誠(chéng)然,昇騰芯片在硬件參數(shù)上要遜于英偉達(dá)芯片,但作為通信起家的公司,華為通過全互聯(lián)對(duì)等架構(gòu)的研發(fā),實(shí)現(xiàn)了對(duì)英偉達(dá)NVL 72在稠密BF16算力、網(wǎng)絡(luò)互聯(lián)總帶寬的反超。
媒體溝通會(huì)上,當(dāng)被問到如何看待華為等競(jìng)爭(zhēng)對(duì)手時(shí),黃仁勛坦言,“我們已經(jīng)做了30年,他們(華為)才做幾年,現(xiàn)在沒有哪家公司比英偉達(dá)付出更多精力來(lái)建造AI生態(tài),而華為已經(jīng)能和我們相提并論,這說(shuō)明了一些問題。”
同樣在近期抓住機(jī)會(huì)的還有寒武紀(jì)。根據(jù)此前發(fā)布的一季度財(cái)報(bào),這家公司的營(yíng)收從去年同期的0.26億暴增至11.11億,并首次在單季度實(shí)現(xiàn)盈利。盡管這段時(shí)期與英偉達(dá)H20的對(duì)華禁售并不完全重疊,但考慮到下游廠商的備貨周期,已經(jīng)足夠說(shuō)明問題。
面對(duì)國(guó)產(chǎn)AI算力芯片的洶涌來(lái)襲,黃仁勛和他的英偉達(dá),恐怕等不起。
更重要的是,正如虎嗅本月15日文章《黃仁勛釋懷了》所指出的,大模型向國(guó)產(chǎn)算力平臺(tái)遷移是個(gè)“單向”的過程,隨著這個(gè)過程的推進(jìn),無(wú)論從經(jīng)營(yíng)成本來(lái)看,還是從風(fēng)險(xiǎn)管控來(lái)看,在遷移部署完成后都不大可能再回歸英偉達(dá)生態(tài)當(dāng)中。
因此,當(dāng)下的黃仁勛才會(huì)迫不及待地表態(tài),并高調(diào)宣布英偉達(dá)高算力芯片重新回歸國(guó)內(nèi)市場(chǎng)。
押寶中國(guó)具身智能
如無(wú)意外,在H20芯片積壓的庫(kù)存消耗殆盡后,這款產(chǎn)品將不會(huì)再繼續(xù)生產(chǎn),黃仁勛昨天也側(cè)面證實(shí)了這一點(diǎn)。
對(duì)于未來(lái)中國(guó)市場(chǎng),英偉達(dá)預(yù)計(jì)將主推基于Blackwell架構(gòu)打造的“B30芯片”,需要說(shuō)明的是,這同樣是一枚中國(guó)特供版芯片,而且極有可能是一次“反向升級(jí)”。
根據(jù)Wccftech的爆料,圍繞B30構(gòu)建的機(jī)架級(jí)解決方案相比于H20部分性能有所削弱,但預(yù)計(jì)能效會(huì)比后者高出30%,采購(gòu)成本降低40%,而價(jià)格降低是建立在HBM芯片改用GDDR7的基礎(chǔ)上。
鑒于大模型預(yù)訓(xùn)練階段已基本結(jié)束,除非B30芯片在推理場(chǎng)景中的能效比有著大幅提高,不然B30芯片對(duì)于國(guó)內(nèi)廠商的需求可能并沒有那么高。
而此次黃仁勛在北京期間,也并沒有透露這枚芯片的進(jìn)展。與之形成鮮明對(duì)比的是,圍繞“人形機(jī)器人”領(lǐng)域的表態(tài)卻異常密集,成為此次行程的另一大焦點(diǎn)。
在被問到如何看待中國(guó)人形機(jī)器人產(chǎn)業(yè)時(shí),黃仁勛表示有三個(gè)關(guān)鍵點(diǎn):
第一,全球都面臨嚴(yán)重的勞動(dòng)力短期,制造業(yè)缺口甚至達(dá)到千萬(wàn)級(jí),提高自動(dòng)化水平將顯著推動(dòng)全球GDP增長(zhǎng)。
第二,人形機(jī)器人與AI的技術(shù)結(jié)合正合時(shí)宜,兩個(gè)領(lǐng)域同步推進(jìn)。
第三,中國(guó)已擁有非常優(yōu)秀的AI技術(shù),在機(jī)電一體化上做的非常出色,而且還有龐大的制造業(yè)基礎(chǔ)來(lái)部署這些機(jī)器人。
“因此,我對(duì)中國(guó)人形機(jī)器人的發(fā)展非常樂觀。”
不過,可能黃仁勛沒有提到的一個(gè)原因是,在中國(guó)市場(chǎng)推廣英偉達(dá)的人形機(jī)器人服務(wù),其實(shí)是一項(xiàng)非常“因地制宜”的策略。
一方面,人形機(jī)器人供應(yīng)鏈暫時(shí)沒有被明確列入到對(duì)華出口限制中;另一方面,英偉達(dá)在人形機(jī)器人領(lǐng)域有著龐大且完整的技術(shù)棧,即便在充滿不確定的地緣政治中,也完全可以做到“狡兔三窟”。
比如要部署在端側(cè)的計(jì)算機(jī),英偉達(dá)有Jeston Thor;如果需要做仿真訓(xùn)練,英偉達(dá)有Omniverse平臺(tái);如果需要讓機(jī)器人通過模仿學(xué)習(xí)或通過試錯(cuò)與強(qiáng)化學(xué)習(xí)的反饋來(lái)學(xué)習(xí)新技能,英偉達(dá)還有Isaac Lab。
哪怕連基礎(chǔ)模型都搞不定的話,沒關(guān)系,英偉達(dá)還有GROOT N1。
如果說(shuō)在生成式AI時(shí)代,英偉達(dá)是行業(yè)背后的“賣鏟人”,那么到了具身智能時(shí)期,英偉達(dá)可能想的是將所有生產(chǎn)工具全部包辦。
在具身智能創(chuàng)業(yè)如火如荼的中國(guó),英偉達(dá)未來(lái)的市場(chǎng)潛力不言自明。
值得一提的是,過去兩年的GTC大會(huì)上,黃仁勛曾展示了多款來(lái)自國(guó)內(nèi)廠商的人形機(jī)器人,而在這次的“鏈博會(huì)”展臺(tái)上,英偉達(dá)則帶來(lái)了諸如“加速進(jìn)化”、“智平方”等人形機(jī)器人新秀企業(yè),主打一個(gè)“一碗水端平”。
CUDA,被動(dòng)兼容?
在昨天的媒體溝通會(huì)上,黃仁勛還有一番表態(tài)讓人頗感意外。
當(dāng)被問到英偉達(dá)是否會(huì)考慮開源CUDA時(shí),黃仁勛表示,“如果一個(gè)平臺(tái)與CUDA兼容,我覺得是沒問題的。實(shí)際上,CUDA本身就比較開發(fā),你可以查閱CUDA的詳細(xì)版本,然后基于此開發(fā)兼容版本。因此,從某種程度上來(lái)說(shuō),CUDA已經(jīng)是開源的。”
“這和X86架構(gòu)不同,如果你開發(fā)兼容X86的產(chǎn)品,他們可能會(huì)不滿,但如果你開發(fā)兼容CUDA的產(chǎn)品,我完全不會(huì)介意。”話畢,黃仁勛還不忘隔空cue下英特爾。
不過,過去英偉達(dá)在CUDA的兼容問題上是較為敏感的。
比如在去年3月,英偉達(dá)就在CUDA 11.6更新版本的最終用戶許可協(xié)議(EULA)中加入了一個(gè)條款:不得對(duì)使用 SDK 組件生成的軟件產(chǎn)品的任何部分進(jìn)行逆向工程、反編譯或反匯編,以便轉(zhuǎn)換此類軟件產(chǎn)品、從而在非英偉達(dá)平臺(tái)上運(yùn)行。
那么在實(shí)際產(chǎn)品開發(fā)中,是否有企業(yè)這么做呢?應(yīng)該說(shuō),不止一家公司實(shí)踐過。
比如AMD ROCm的就是在API接口協(xié)議和編譯器層面與CUDA保持一致的基礎(chǔ)上,開發(fā)具有自主知識(shí)產(chǎn)權(quán)的工具庫(kù)、技術(shù)棧。
還有一些國(guó)內(nèi)廠商則更加直接,通過調(diào)用CUDA函數(shù)來(lái)讓未經(jīng)修改的二級(jí)制文件運(yùn)行在第三方卡上,這的確切實(shí)傷害了英偉達(dá)的利益。
但從黃仁勛昨日的公開表態(tài)中,不難察覺英偉達(dá)在 “被動(dòng)兼容 CUDA” 這一關(guān)鍵問題上的心態(tài)已悄然發(fā)生轉(zhuǎn)變。
這種轉(zhuǎn)變背后存在雙重現(xiàn)實(shí)考量:一方面,正如前文所提及的,英偉達(dá)當(dāng)前最憂心的是,在美國(guó)政府政策持續(xù)搖擺的背景下,其在潛力巨大的中國(guó)市場(chǎng)可能被迫讓渡出“市場(chǎng)真空”,進(jìn)而給競(jìng)品創(chuàng)造可乘之機(jī)。
另一方面,正如黃仁勛強(qiáng)調(diào)的,英偉達(dá)是全球少數(shù)幾家能夠?qū)崿F(xiàn)從算法架構(gòu)、系統(tǒng)軟件、硬件系統(tǒng)、網(wǎng)絡(luò)技術(shù)直至芯片設(shè)計(jì)的全棧創(chuàng)新的企業(yè),即便硬件銷售上有所損失,只要能牢牢掌控 CUDA 生態(tài)的核心影響力,依然可以通過軟件授權(quán)、技術(shù)服務(wù)等路徑實(shí)現(xiàn)商業(yè)價(jià)值回流。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。