2025-12-17 21:37:11
12月16日,阿里千問App上線視頻生成模型萬相2.6,推出“AI小劇場”功能,首創“角色合拍”玩法,對標Open AI的Sora2。目前,AI視頻生成領域競爭激烈,千問App也有不少競爭對手。AI視頻生成戰場不僅是技術比拼,阿里若想“硬剛”Open AI,在生態能力與用戶洞察方面需多下功夫。
每經記者|陳婷 每經編輯|董興生
AI(人工智能)視頻生成,正在追求變得好玩?
12月16日,阿里千問App(應用程序)同步上線最新視頻生成模型萬相2.6,并向所有用戶免費開放。《每日經濟新聞》記者了解到,基于該模型的核心能力,千問App上線了“AI小劇場”功能(即基于該模型的角色扮演新功能),在國內首次實現了“角色合拍”玩法。
記者體驗千問App后發現,點進“AI小劇場”,的確可以和知名角色、歷史人物合拍視頻。
根據示例,輸入簡單描述,“蘇軾”就能穿越時空被高考難到崩潰;只要上傳自己的照片錄入角色,就能和美國隊長出現在同一視頻中,接受他送的玫瑰花。此外,視頻生成后,還可以一鍵分享鏈接到微信好友、朋友圈和QQ好友。
值得注意的是,這一功能對標的正是Open AI(美國開放人工智能研究中心)旗下的Sora2(OpenAI發布的新一代視頻生成模型)。“AI小劇場”玩法目前僅Sora2大模型有類似功能,而Sora2的優勢便在于,其同步上線了內容社區,開啟了AI內容社區化時代。
當前,在AI視頻生成領域,中國企業和美國企業正展開激烈競爭。根據招商證券統計,目前,該領域已有15個以上被廣泛認可的模型。在此大背景下,阿里持續加碼視頻生成賽道意欲何為?

事實上,今年以來,阿里持續布局視頻生成賽道。
2月,據阿里云披露消息,阿里云視頻生成大模型萬相2.1(Wan)重磅開源,此次開源采用Apache2.0協議(帕奇授權協議,是Apache軟件基金會發布的開源軟件許可協議),14B(140億參數,B 指10億參數)和1.3B(13億參數)兩個參數規格的全部推理代碼和權重全部開源,同時支持文生視頻和圖生視頻任務。
而在今年9月的云棲大會上,阿里發布通義萬相Wan2.5 preview系列模型,首次實現音畫同步的視頻生成能力,視頻時長從5秒提升至10秒,支持24幀每秒的1080P(視頻顯示格式)高清輸出,通義App第一時間接入了視頻生成模型。
11月17日,阿里正式宣布“千問”項目,全力進軍AI to C(人工智能直接面向消費者 )市場,“通義”App正式改名為“千問”App。12月初,千問App便已接入萬相系列當時的最新模型Wan2.5。
這一次,千問App第一時間接入的萬相2.6視覺大模型,支持音畫同步、多鏡頭生成及聲音驅動等功能,號稱是全球功能最全的視頻生成模型,也是國內首個支持角色扮演功能的視頻生成模型。阿里方面表示,這次更新的萬相2.6,有的功能比如音頻驅動生成視頻,Sora2尚未實現。
為何這次千問卯足了勁對標Sora2,雙方之間究竟差距何在?
根據華泰證券相關研報,9月30日,Open AI發布最新音視頻生成模型Sora2,并同步試運行由該模型驅動的iOS(蘋果操作系統)社交應用Sora。
該研報認為,Sora此次較大的突破在于推出AI社交平臺,有望通過雙邊效應實現自我強化,進一步降低內容創作的門檻,吸引全球開發者與普通用戶共創內容生產,并通過垂直分發機制提升內容消費效率,有望創造新型社交場景。
有觀點認為,Sora2及其配套社交應用的發布,標志著AI視頻生成與社交互動進入融合階段,或迎來AI視頻生成的“ChatGPT(OpenAI 發布的大語言模型 )時刻”。
工信部信息通信經濟專家委員會委員盤和林對《每日經濟新聞》記者表示,如今,在AI大模型算法能力上,中國相對較強,具備追上Sora2的能力,且阿里本身具備比較豐富的數據資源和算力資源,即便短期有些性能差距,阿里千問也能通過持續的算力和數據投入來解決問題。
“性能上應該是能夠無限接近Sora2。當然,現階段還是有些差距的,多是一些生成細節上的差距。”盤和林說。
記者在千問App實測“AI小劇場”功能發現,在選擇現存示例進行“AI翻拍”的情況下,其視頻生成時間一般在2到5分鐘,可生成一段10秒視頻。
不過,當記者輸入描述,要求“孫悟空和財神擁抱”時,千問App的理解并不到位,給出了前后不相關的數個視頻畫面,包括孫悟空舉起玫瑰花、兩個財神擁抱。
就視頻生成賽道而言,千問App在國內也有不少競爭對手。
同樣在12月16日,字節跳動旗下“即夢AI”網頁版官宣全面升級,打造一站式“AI片場”。此次升級核心是即夢AI最新視頻生成能力“視頻3.5 Pro”,支持視頻與音頻同時生成,人物口型、樂器演奏、環境音效等元素無需再后期配音,提升視頻的真實感與沉浸感。
今年12月,快手旗下“可靈AI”推出視頻生成2.6模型。據介紹,該模型提供了“音畫同出”能力,能夠在單次生成中,輸出包含自然語言、動作音效以及環境氛圍音的完整視頻。目前,其語音支持生成中文與英文,生成的視頻長度最長可達10秒。12月5日,可靈AI宣布,可靈O1主體庫和對比模板兩大功能全新上線。
盤和林認為,各大視頻生成AI之間,差距都比較小。“千問視頻生成能力應該和即夢、可靈在同一起跑線。”他表示,因為各家在算法、算力、數據等基礎上處于近似的水平,AI視頻生成應用是這些基礎的結果而已。
值得一提的是,這些大廠共同爭奪的,是一個廣闊的市場前景。
招商證券相關研報提及,根據Grand View Horizon(市場研究機構),2025年全球AI視頻生成市場規模預計達8億美元。在其基本情形假設中,預計AI視頻生成可觸達市場規模接近400億美元,包含B端規模360億美元(90%占比)和C端規模40億美元(10%占比)。
不過,12月13日,據《中國經營報》報道,近日,硅谷風投機構a16z合伙人Olivia Moore在社交媒體爆料稱,Sora的下載量仍在增長,但早期用戶留存率數據看起來相當疲軟。他曬出了一張App數據監測服務SensorTower的數據截圖:Sora的1天、7天、30天和60天用戶留存率分別為10%、2%、1%和0%。
不過,就阿里在AI上的整體布局來看,千問App上線“AI小劇場”的訴求未必是劍指AI視頻生成市場這么簡單。千問App剛上線時,阿里便宣稱,其要與ChatGPT展開全面競爭,此次推出視頻生成新玩法,或是試圖縮小與Open AI的綜合差距,為正面抗衡鋪路。
截至12月17日,千問App公測已滿一個月。一個月來,這款App共計更新18個版本,正加強創作、學習、辦公三大場景能力。12月10日,阿里官方信息顯示,自11月17日公測僅23天,千問月活躍用戶數(含App、Web、PC端)已突破3000萬,成為當前全球增長最快的AI應用。
組織架構的調整也在進行中。12月9日消息,阿里已成立千問C端事業群,由阿里巴巴集團副總裁吳嘉負責。據媒體報道,阿里在內部溝通中提及,千問C端事業群的首要目標是將千問打造成為一款超級App,成為AI時代用戶的第一入口。
AI視頻生成的戰場硝煙彌漫,時至如今,這場較量不僅是技術參數的比拼,更是各家生態能力與用戶洞察的對決。在此大背景下,在AI賽道上,阿里若想“硬剛”Open AI,需要做的還有很多。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP