AI視頻生成賽道又熱鬧起來了。4月,快手可靈發布2.0視頻生成模型,6月,字節跳動發布了即夢3.0 Pro視頻模型,就在昨天,谷歌宣布Veo3正式上線,今天MiniMax也加入混戰隊列,開始卷性價比了。
6月18日,MiniMax在海內外官方平臺宣布,新視頻生成模型海螺AI(海螺02)上線,同時發布了一段大秀雜技的AI視頻。官方表示,這段視頻是由3位藝術家耗時1.5天,使用海螺02生成的多個6-10s視頻,再拼接剪輯而成。
雜技畫面對AI視頻生成來說一直是較有難度的內容,此前AI生成畫面時往往肢體拼接混亂,無法準確模仿復雜的人類動作。從此次畫面效果來看無論是光影、人類動作、物理模仿都完成得很好。
不過,需要指出的是,有AI創作者對第一財經表示,AI視頻生成還涉及一個成功率的問題,因此樣片是完美的,但過程中他們進行了多少次“抽卡”,外界并不能知曉。所謂抽卡指的是, AI往往不是一次就能成功生成用戶想要的畫面,可能會有出錯的概率,因此行業會選擇多次生成直到得到自己想要的畫面。
不過,即便如此,上述AI創作者認為,這次海螺AI的更新是不錯的,行業整體水平都在提升。
在競技場Artificial Analysis Video Arena上,目前圖生視頻的排行榜里,新版的海螺AI排在第二位,第一是字節的視頻生成模型 Seedance 1.0 pro,也就是剛更新不久的即夢3.0 Pro。排在第三位的是谷歌最新的Veo3,快手可靈的兩個版本排在第四和第五位。
當然,評分不能說明所有問題,有從業者對記者表示,可以將這類競技場類比成高考,可以通過做題去達到規則的要求,但這些評分至少是個參考。
在X平臺,有不少博主用戶對海螺02進行了測試,記者發現,大多數博主都提到,海螺02視頻模型的物理運動效果很好。有博主評測認為“海螺02似乎是第一個準確呈現淚珠的平臺”。
雖然這些畫面令人印象深刻,但真正工業化場景用起來還需要更多的測試。一家影視公司@Fugazy Film就表示,他更想看的是劍斗場面,“我們有一個電影項目正在籌備中,但我不知道在這些平臺中,是否能把劍斗和電影化的戰斗處理做好,否則項目就不能繼續推進。”
這次除了性能的提升,海螺AI也卷起了價格。官方表示,得益于架構創新,現在可以給創作者提供業內最優的價格。
從表格來看,不論對比國內大廠,還是海外大廠以及創業公司,海螺AI都是最便宜的,花費1000元能生成1.7萬條1080p視頻,字節的即夢是1.4萬條,可靈是5000條,谷歌的Veo3是2000條。
不過,還要注意的是,除了看價格,還得看“抽卡率”,如果以更高的價格,能以更少地步驟生成想要的視頻,這也是另一種性價比。目前還要觀察從業者的實際應用體驗。
海螺在這次發布時還提到,從去年8月底發布海螺視頻,至今為止幫助創作者生成了超過3.7億個視頻。
在4月發布時,快手可靈也公布了一些更豐富的用戶創作數據,可以作為比較。截至2025年4月,可靈AI全球用戶規模突破2200萬,累計生成1.68億個視頻及3.44億張圖片素材。自去年6月上線至今年4月的時間里,可靈AI的月活用戶數量增長25倍。
在發布2025年一季度財報時, 快手還透露了可靈AI的賺錢能力——季度營收超過1.5億元。在視頻生成早期達到這一收入,意味著AI視頻領域的商業化前景可期,市場潛力巨大。
中金此前發布研報稱,可靈AI如獨立分拆,估值約為60億美元,顯示出其巨大的商業價值。根據POE調查報告,快手可靈系列AI影片工具在全球市場的占有率為30.7%,逐步滲透專業市場,聚焦高價值用戶。
海螺AI在去年9月發布后,在AI創作者群體中有不小的聲量,但隨著行業各家紛紛迭代新版本,在迅速變化的市場中,海螺AI看起來落后了。此次發布新版本,“在巨大競爭中一步一個腳印地(爬)回到全球SOTA”,重回排行榜前列,太不容易了,MiniMax一位負責人在朋友圈感慨。
在去年MiniMax第一次發布海螺時,第一財經記者曾問及MiniMax創始人閆俊杰,布局視頻生成有哪些必要性,閆俊杰彼時認為,人類社會的信息更多體現在多模態內容上,?活中?字交互只是很?的?部分,更多的是語?和視頻交互。
因此,為了能夠有非常高的用戶覆蓋度,以及更高的使用深度,作為大模型廠商,唯一的辦法是能夠輸出多模態的內容,而不是只是輸出單純的基于文字的內容。“一定要能做多模態。” 閆俊杰說。
從這幾個月來看,視頻生成賽道又開始卷起來了,但這仍然只是技術迭代的初期,最終誰能勝出,搶占市場還未可知。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。