本站4月30日消息,日前,阿里巴巴發(fā)布并開源新一代通義千問模型Qwen3,參數(shù)量?jī)H為DeepSeek-R1的1/3,成本大幅下降,性能則全面超越DeepSeek-R1、OpenAI-o1等全球頂尖模型,登頂全球最強(qiáng)開源模型。
Qwen3發(fā)布當(dāng)天,摩爾線程宣布,其率先完成了Qwen3全系列模型在全功能GPU上的高效支持。
摩爾線程表示,這一成果充分驗(yàn)證了MUSA架構(gòu)和全功能GPU的技術(shù)成熟度與可靠性。
目前,主流推理引擎均可基于摩爾線程MUSA平臺(tái)運(yùn)行Qwen3系列模型。
摩爾線程稱,MUSA平臺(tái)能夠作為vLLM、Ollama、GPU Stack等各類主流開源推理引擎的后端,為Qwen3系列模型的高效運(yùn)行提供強(qiáng)大動(dòng)力。
例如,QWen3-235B-A22B(Qwen3系列最大參數(shù)量模型),基于vLLM-MUSA引擎在摩爾線程全功能GPU上穩(wěn)定運(yùn)行。
據(jù)了解,此次開源的兩款MoE模型是Qwen3-235B-A22B和Qwen3-30B-A3B;同時(shí)還包括六個(gè)Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。