本站4月29日消息,馬斯克剛剛在社交平臺X上稱,下周將向SuperGrok訂閱者推出Grok 3.5,并將該條信息頂置。
據馬斯克稱,Grok 3.5是第一個能夠準確回答有關火箭發動機或電化學技術問題的人工智能。同時,Grok可以從第一原理推理并得出互聯網上根本不存在的答案。
Grok 3.5被馬斯克旗下的xAI宣傳為“全球首個人工智能能從第一性原理推理,生成網絡上不存在的答案”。
而今年2月18日,xAI正式發布Grok 3,并在兩天后把Grok 3免費向所有公眾開放,超越ChatGPT,登頂蘋果應用商店免費應用下載排行榜第一名。
馬斯克曾稱Grok 3為“地球上最聰明的人工智能”。
令人值得關注的是,馬斯克“官宣下周推出Grok 3.5”的這一舉動恰巧發生在阿里巴巴發布Qwen3(千問3)之后。
4月29日凌晨4點,阿里巴巴開源新一代通義千問模型Qwen3,參數量僅為DeepSeek-R1的1/3,成本大幅下降,性能全面超越R1、OpenAI-o1等全球頂尖模型,登頂全球最強開源模型。
據悉,Qwen3是國內首個“混合推理模型”,“快思考”與“慢思考”集成進同一個模型,對簡單需求可低算力“秒回”答案,對復雜問題可多步驟“深度思考”,大大節省算力消耗。
作為Qwen系列全新一代的混合推理模型,Qwen3在GPQA、AIME24/25、LiveCodeBench等多個權威評測中表現出極具競爭力的結果。
在奧數水平的AIME25測評中,Qwen3斬獲81.5分,刷新開源紀錄。
在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關,表現甚至超過Grok3。
在評估模型人類偏好對齊的ArenaHard測評中,Qwen3以95.6分超越OpenAI-o1及DeepSeek-R1。
性能大幅提升的同時,Qwen3的部署成本還大幅下降,僅需4張H20即可部署Qwen3滿血版,顯存占用僅為性能相近模型的三分之一。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。