首頁頭條

借力萬相2.6，開放“AI小劇場” 千問App拿下3000萬月活后的下一場豪賭：視頻社交化？

2025-12-17 21:37:11

12月16日，阿里千問App上線視頻生成模型萬相2.6，推出“AI小劇場”功能，首創“角色合拍”玩法，對標Open AI的Sora2。目前，AI視頻生成領域競爭激烈，千問App也有不少競爭對手。AI視頻生成戰場不僅是技術比拼，阿里若想“硬剛”Open AI，在生態能力與用戶洞察方面需多下功夫。

每經記者｜陳婷每經編輯｜董興生

AI（人工智能）視頻生成，正在追求變得好玩？

12月16日，阿里千問App（應用程序）同步上線最新視頻生成模型萬相2.6，并向所有用戶免費開放。《每日經濟新聞》記者了解到，基于該模型的核心能力，千問App上線了“AI小劇場”功能（即基于該模型的角色扮演新功能），在國內首次實現了“角色合拍”玩法。

記者體驗千問App后發現，點進“AI小劇場”，的確可以和知名角色、歷史人物合拍視頻。

根據示例，輸入簡單描述，“蘇軾”就能穿越時空被高考難到崩潰；只要上傳自己的照片錄入角色，就能和美國隊長出現在同一視頻中，接受他送的玫瑰花。此外，視頻生成后，還可以一鍵分享鏈接到微信好友、朋友圈和QQ好友。

值得注意的是，這一功能對標的正是Open AI（美國開放人工智能研究中心）旗下的Sora2（OpenAI發布的新一代視頻生成模型）。“AI小劇場”玩法目前僅Sora2大模型有類似功能，而Sora2的優勢便在于，其同步上線了內容社區，開啟了AI內容社區化時代。

當前，在AI視頻生成領域，中國企業和美國企業正展開激烈競爭。根據招商證券統計，目前,該領域已有15個以上被廣泛認可的模型。在此大背景下，阿里持續加碼視頻生成賽道意欲何為？

對標Sora2，阿里持續加碼視頻生成

事實上，今年以來，阿里持續布局視頻生成賽道。

2月，據阿里云披露消息，阿里云視頻生成大模型萬相2.1（Wan）重磅開源，此次開源采用Apache2.0協議（帕奇授權協議，是Apache軟件基金會發布的開源軟件許可協議），14B（140億參數，B 指10億參數）和1.3B（13億參數）兩個參數規格的全部推理代碼和權重全部開源，同時支持文生視頻和圖生視頻任務。

而在今年9月的云棲大會上，阿里發布通義萬相Wan2.5 preview系列模型，首次實現音畫同步的視頻生成能力，視頻時長從5秒提升至10秒，支持24幀每秒的1080P（視頻顯示格式）高清輸出，通義App第一時間接入了視頻生成模型。

11月17日，阿里正式宣布“千問”項目，全力進軍AI to C（人工智能直接面向消費者）市場，“通義”App正式改名為“千問”App。12月初，千問App便已接入萬相系列當時的最新模型Wan2.5。

這一次，千問App第一時間接入的萬相2.6視覺大模型，支持音畫同步、多鏡頭生成及聲音驅動等功能，號稱是全球功能最全的視頻生成模型，也是國內首個支持角色扮演功能的視頻生成模型。阿里方面表示，這次更新的萬相2.6，有的功能比如音頻驅動生成視頻，Sora2尚未實現。

為何這次千問卯足了勁對標Sora2，雙方之間究竟差距何在？

根據華泰證券相關研報，9月30日，Open AI發布最新音視頻生成模型Sora2，并同步試運行由該模型驅動的iOS（蘋果操作系統）社交應用Sora。

該研報認為，Sora此次較大的突破在于推出AI社交平臺，有望通過雙邊效應實現自我強化，進一步降低內容創作的門檻，吸引全球開發者與普通用戶共創內容生產，并通過垂直分發機制提升內容消費效率，有望創造新型社交場景。

有觀點認為，Sora2及其配套社交應用的發布，標志著AI視頻生成與社交互動進入融合階段，或迎來AI視頻生成的“ChatGPT（OpenAI 發布的大語言模型）時刻”。

工信部信息通信經濟專家委員會委員盤和林對《每日經濟新聞》記者表示，如今，在AI大模型算法能力上，中國相對較強，具備追上Sora2的能力，且阿里本身具備比較豐富的數據資源和算力資源，即便短期有些性能差距，阿里千問也能通過持續的算力和數據投入來解決問題。

“性能上應該是能夠無限接近Sora2。當然，現階段還是有些差距的，多是一些生成細節上的差距。”盤和林說。

記者在千問App實測“AI小劇場”功能發現，在選擇現存示例進行“AI翻拍”的情況下，其視頻生成時間一般在2到5分鐘，可生成一段10秒視頻。

不過，當記者輸入描述，要求“孫悟空和財神擁抱”時，千問App的理解并不到位，給出了前后不相關的數個視頻畫面，包括孫悟空舉起玫瑰花、兩個財神擁抱。

千問App月內狂推18個版本，阿里“硬剛”Open AI背后的豪賭

就視頻生成賽道而言，千問App在國內也有不少競爭對手。

同樣在12月16日，字節跳動旗下“即夢AI”網頁版官宣全面升級，打造一站式“AI片場”。此次升級核心是即夢AI最新視頻生成能力“視頻3.5 Pro”，支持視頻與音頻同時生成，人物口型、樂器演奏、環境音效等元素無需再后期配音，提升視頻的真實感與沉浸感。

今年12月，快手旗下“可靈AI”推出視頻生成2.6模型。據介紹，該模型提供了“音畫同出”能力，能夠在單次生成中，輸出包含自然語言、動作音效以及環境氛圍音的完整視頻。目前，其語音支持生成中文與英文，生成的視頻長度最長可達10秒。12月5日，可靈AI宣布，可靈O1主體庫和對比模板兩大功能全新上線。

盤和林認為，各大視頻生成AI之間，差距都比較小。“千問視頻生成能力應該和即夢、可靈在同一起跑線。”他表示，因為各家在算法、算力、數據等基礎上處于近似的水平，AI視頻生成應用是這些基礎的結果而已。

值得一提的是，這些大廠共同爭奪的，是一個廣闊的市場前景。

招商證券相關研報提及，根據Grand View Horizon（市場研究機構），2025年全球AI視頻生成市場規模預計達8億美元。在其基本情形假設中，預計AI視頻生成可觸達市場規模接近400億美元，包含B端規模360億美元（90%占比）和C端規模40億美元（10%占比）。

不過，12月13日，據《中國經營報》報道，近日，硅谷風投機構a16z合伙人Olivia Moore在社交媒體爆料稱，Sora的下載量仍在增長，但早期用戶留存率數據看起來相當疲軟。他曬出了一張App數據監測服務SensorTower的數據截圖：Sora的1天、7天、30天和60天用戶留存率分別為10%、2%、1%和0%。

不過，就阿里在AI上的整體布局來看，千問App上線“AI小劇場”的訴求未必是劍指AI視頻生成市場這么簡單。千問App剛上線時，阿里便宣稱，其要與ChatGPT展開全面競爭，此次推出視頻生成新玩法，或是試圖縮小與Open AI的綜合差距，為正面抗衡鋪路。

截至12月17日，千問App公測已滿一個月。一個月來，這款App共計更新18個版本，正加強創作、學習、辦公三大場景能力。12月10日，阿里官方信息顯示，自11月17日公測僅23天，千問月活躍用戶數（含App、Web、PC端）已突破3000萬，成為當前全球增長最快的AI應用。

組織架構的調整也在進行中。12月9日消息，阿里已成立千問C端事業群，由阿里巴巴集團副總裁吳嘉負責。據媒體報道，阿里在內部溝通中提及，千問C端事業群的首要目標是將千問打造成為一款超級App，成為AI時代用戶的第一入口。

AI視頻生成的戰場硝煙彌漫，時至如今，這場較量不僅是技術參數的比拼，更是各家生態能力與用戶洞察的對決。在此大背景下，在AI賽道上，阿里若想“硬剛”Open AI，需要做的還有很多。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

上一篇文章

南京博物院發布情況說明

返回每經網首頁

下一篇文章

離“上岸”再近一步！融創中國約96億美元現有債務將獲全面解除及免除