2025-08-06 17:53:24
當地時間8月5日,谷歌、Anthropic和OpenAI三大AI巨頭相繼發布新模型。從戰略上看,三家巨頭“打法”各異:谷歌推出Genie 3世界模型,為通用人工智能(AGI)鋪路;Anthropic深耕編程這一高價值賽道;OpenAI則重返開源,意在構建開發者生態。AI行業的競爭或由此進入新階段。
每經記者|宋欣悅 每經編輯|蘭素英
圖片來源:視覺中國-VCG211550173673
當地時間8月5日,谷歌、Anthropic和OpenAI相繼推出“王炸”新模型,上演了一場“三國殺”。
在這次激烈的交鋒中,三巨頭展示了截然不同的戰略布局:
谷歌押注未來,發布了第三代通用型世界模型Genie 3,為通用人工智能(AGI)的實現鋪設關鍵基石;
Anthropic繼續深耕編程這一高價值賽道,發布編程能力更強的Claude Opus 4.1模型;
OpenAI則以開源作為“生態誘餌”,發布了免費、可商用的gpt-oss系列模型,意在構建龐大的開發者生態。
這場密集“出招”揭開了差異化競爭的底牌。而8月的AI戰場或將持續 “高能”。Anthropic 5日預告稱,將在未來幾周內發布“重大改進”。OpenAI此前也宣布,“重要的一周即將到來”,外界猜測GPT-5或將登場。
8月5日晚,谷歌以第三代通用型世界模型Genie 3的發布拉開了這場“暗戰”的序幕。
Genie 3是一款顛覆性的通用型世界模型,能夠生成前所未有的多樣化交互式環境。
圖片來源:谷歌DeepMind官網
用戶只需輸入文本、圖片甚至草圖,Genie 3就能創造出一個風格一致、符合物理邏輯的3D環境,并允許用戶實時在其中行動和互動。比如,Genie 3能理解“向左走”或“跳起來”等自然語言指令,并即時渲染出對應的第一人稱視角畫面。
與此前的視頻生成模型(如谷歌自家的Veo)和前代模型相比,Genie 3主要進行了以下升級:
一是實現高清實時生成。它能以720p分辨率、24幀/秒的速度在消費級顯卡上流暢運行,畫面流暢度媲美傳統游戲引擎。
圖片來源:谷歌DeepMind官網
二是具備視覺記憶與一致性。Genie 3為場景要素建立了持久的隱變量,解決了早期版本“轉身即刷新”的沉浸感斷裂問題。模型可以在生成每一幀的同時,回溯并利用最長可達1分鐘的歷史信息,確保環境的連貫性。
三是加入可提示的世界事件(Promptable World Events)。除了導航指令外,Genie 3還支持用戶追加提示來實時改變場景,例如“下雨”“加入兩只狗”,模型會即時重算物理與光照,讓世界狀態隨劇情動態演進。
需要強調的是,Genie 3的核心優勢是通用性,游戲應用只是其中一個場景。Genie 3通過生成可交互的虛擬世界,為游戲開發、模擬器、機器人訓練乃至元宇宙的實現路徑提供了極具震撼力的雛形。
英偉達的研究科學家Jim Fan直接將其稱為“一次量子躍遷”。這表明谷歌正扮演著“下一個Transformer時刻”的締造者角色,為走向AGI提供關鍵拼圖。
在谷歌“出招”大約2個半小時后,Anthropic宣布推出新模型Claude Opus 4.1,直接瞄準編程這一“變現高地”。據稱,該模型的編程、研究和數據分析能力有顯著提升。
據Anthropic介紹,在SWE-bench Verified基準測試中,Opus 4.1的編碼性能達到74.5%,相比前一版本Opus 4提升了2個百分點,而相較于Sonnet 3.7的提升更為明顯,后者得分僅為62.3%。
圖片來源:Anthropic官網
在另一項衡量代碼生成、調試和邏輯推理能力的HumanEval+基準測試中,Claude 4.1 Opus的得分達到85.2%,首次超越了此前由GPT-4o創下的84.9%的紀錄。
Anthropic援引開源軟件社區GitHub的數據強調,Opus 4.1此次升級的重點在于多文件代碼重構的性能提升。
此外,根據AI編程公司Windsurf的報告,Opus 4.1在其初級開發人員基準測試中比Opus 4提高了一個標準差,性能提升幅度與從Sonnet 3.7到Sonnet 4的提升大致相當。
在定價方面,Opus 4.1與Opus 4保持一致,輸入和輸出價格分別為15美元/百萬Token和75美元/百萬Token,基本實現了“加量不加價”。這有望進一步鞏固Anthropic在編程這一高付費意愿場景的競爭力。
當天壓軸登場的OpenAI則選擇以“開源”破局。該公司推出了兩款開放權重模型:gpt-oss-120b和gpt-oss-20b,標志著其時隔六年重返開源賽道。
這一步棋,OpenAI可謂精明。在閉源模型引領消費者市場后,OpenAI選擇用開源來構建更龐大的生態系統,通過降低門檻,它希望讓gpt-oss成為未來無數AI應用的基礎設施,從而在下一階段的競爭中掌握主動權。
最新發布的兩款開源大模型定位清晰:
gpt-oss-120b擁有1170億參數,每token激活51億參數,是一款為高推理能力、生產級通用場景打造的模型,可以在單張英偉達H100 GPU上高效運行;
gpt-oss-20b更具“普惠性”,總參數為210億,每token激活36億參數,專為低延遲、本地化或專業場景設計,僅需16GB內存即可在消費級筆記本電腦或手機等邊緣設備上部署。
根據OpenAI發布的技術報告,這兩款大模型均為純文本語言模型,在文本處理、代碼生成、數學問題求解等領域表現出色。尤為值得關注的是,gpt-oss-120b在多項基準測試中的表現,媲美甚至超越了專有模型o4-mini。較小的gpt-oss-20b則與o3-mini性能相當,在AIME和HealthBench等測試中表現更佳。
圖片來源:OpenAI技術報告
在技術架構上,gpt-oss模型采用了混合專家(MoE)架構,通過交替使用密集注意力和局部帶狀稀疏注意力機制,實現了高效的推理和內存利用。模型還支持高達128000個token的上下文長度,相當于約300~400頁的小說文本。
同時,模型采用了原生MXFP4量化技術,極大地降低了硬件門檻,使得開發者可以在更低的配置下運行模型。
在許可方面,gpt-oss系列模型采用了對企業友好的Apache 2.0許可協議。這意味著任何消費者、開發者或企業都可以免費下載、進行參數級微調,并將其用于商業服務或創收,而無需向OpenAI支付任何費用。
此外,模型支持本地運行,無需聯網,可以有效滿足金融、醫療、法律等對數據隱私有嚴格要求的行業需求。
還需要指出的是,OpenAI的開源并不徹底。
gpt-oss使用的是OpenAI自定義的“OpenAI Model License 1.0”,其中包含了“毒丸條款”,禁止年度收入超過1億美元或日活躍用戶超過100萬的商業實體,使用gpt-oss來開發與OpenAI核心產品競爭的服務。這一條款精準地將所有潛在的大公司競爭對手排除在外,同時又能讓廣大的中小開發者和研究者進入其生態,是一次重大的戰略轉向。
三家AI巨頭在同一天集體發布新模型,這絕非偶然,意味著AI產業的競爭已進入一個全新的、更復雜的階段。
從戰略上看,谷歌著眼長遠,以Genie 3推進世界模型研發,押注AGI未來;Anthropic深耕垂直變現,錨定編程這一高頻、高付費場景,深挖商業護城河;OpenAI則以開源為餌,通過降低門檻吸引開發者,構建底層生態。
而AI巨頭之間的“混戰”還遠未落幕。
Anthropic在8月5日新聞稿中預告,未來幾周內將發布“重大改進”。前一日,OpenAI高管也喊話:“重要的一周即將到來”,外界普遍猜測,GPT-5或將登場。
種種跡象顯示,8月的AI圈,注定“好戲連臺”。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP