要聞

8月AI圈“大混戰”！谷歌、Anthropic、OpenAI同日“亮劍”，暗藏三種打法

2025-08-06 17:53:24

當地時間8月5日，谷歌、Anthropic和OpenAI三大AI巨頭相繼發布新模型。從戰略上看，三家巨頭“打法”各異：谷歌推出Genie 3世界模型，為通用人工智能（AGI）鋪路；Anthropic深耕編程這一高價值賽道；OpenAI則重返開源，意在構建開發者生態。AI行業的競爭或由此進入新階段。

每經記者｜宋欣悅每經編輯｜蘭素英

圖片來源：視覺中國-VCG211550173673

當地時間8月5日，谷歌、Anthropic和OpenAI相繼推出“王炸”新模型，上演了一場“三國殺”。

在這次激烈的交鋒中，三巨頭展示了截然不同的戰略布局：

谷歌押注未來，發布了第三代通用型世界模型Genie 3，為通用人工智能（AGI）的實現鋪設關鍵基石；

Anthropic繼續深耕編程這一高價值賽道，發布編程能力更強的Claude Opus 4.1模型；

OpenAI則以開源作為“生態誘餌”，發布了免費、可商用的gpt-oss系列模型，意在構建龐大的開發者生態。

這場密集“出招”揭開了差異化競爭的底牌。而8月的AI戰場或將持續 “高能”。Anthropic 5日預告稱，將在未來幾周內發布“重大改進”。OpenAI此前也宣布，“重要的一周即將到來”，外界猜測GPT-5或將登場。

谷歌DeepMind：押注世界模型，瞄準AGI終極戰場

8月5日晚，谷歌以第三代通用型世界模型Genie 3的發布拉開了這場“暗戰”的序幕。

Genie 3是一款顛覆性的通用型世界模型，能夠生成前所未有的多樣化交互式環境。

圖片來源：谷歌DeepMind官網

用戶只需輸入文本、圖片甚至草圖，Genie 3就能創造出一個風格一致、符合物理邏輯的3D環境，并允許用戶實時在其中行動和互動。比如，Genie 3能理解“向左走”或“跳起來”等自然語言指令，并即時渲染出對應的第一人稱視角畫面。

與此前的視頻生成模型（如谷歌自家的Veo）和前代模型相比，Genie 3主要進行了以下升級：

一是實現高清實時生成。它能以720p分辨率、24幀/秒的速度在消費級顯卡上流暢運行，畫面流暢度媲美傳統游戲引擎。

圖片來源：谷歌DeepMind官網

二是具備視覺記憶與一致性。Genie 3為場景要素建立了持久的隱變量，解決了早期版本“轉身即刷新”的沉浸感斷裂問題。模型可以在生成每一幀的同時，回溯并利用最長可達1分鐘的歷史信息，確保環境的連貫性。

三是加入可提示的世界事件（Promptable World Events）。除了導航指令外，Genie 3還支持用戶追加提示來實時改變場景，例如“下雨”“加入兩只狗”，模型會即時重算物理與光照，讓世界狀態隨劇情動態演進。

需要強調的是，Genie 3的核心優勢是通用性，游戲應用只是其中一個場景。Genie 3通過生成可交互的虛擬世界，為游戲開發、模擬器、機器人訓練乃至元宇宙的實現路徑提供了極具震撼力的雛形。

英偉達的研究科學家Jim Fan直接將其稱為“一次量子躍遷”。這表明谷歌正扮演著“下一個Transformer時刻”的締造者角色，為走向AGI提供關鍵拼圖。

Anthropic：錨定編程場景，深挖商業護城河

在谷歌“出招”大約2個半小時后，Anthropic宣布推出新模型Claude Opus 4.1，直接瞄準編程這一“變現高地”。據稱，該模型的編程、研究和數據分析能力有顯著提升。

據Anthropic介紹，在SWE-bench Verified基準測試中，Opus 4.1的編碼性能達到74.5%，相比前一版本Opus 4提升了2個百分點，而相較于Sonnet 3.7的提升更為明顯，后者得分僅為62.3%。

圖片來源：Anthropic官網

在另一項衡量代碼生成、調試和邏輯推理能力的HumanEval+基準測試中，Claude 4.1 Opus的得分達到85.2%，首次超越了此前由GPT-4o創下的84.9%的紀錄。

Anthropic援引開源軟件社區GitHub的數據強調，Opus 4.1此次升級的重點在于多文件代碼重構的性能提升。

此外，根據AI編程公司Windsurf的報告，Opus 4.1在其初級開發人員基準測試中比Opus 4提高了一個標準差，性能提升幅度與從Sonnet 3.7到Sonnet 4的提升大致相當。

在定價方面，Opus 4.1與Opus 4保持一致，輸入和輸出價格分別為15美元/百萬Token和75美元/百萬Token，基本實現了“加量不加價”。這有望進一步鞏固Anthropic在編程這一高付費意愿場景的競爭力。

OpenAI：六年后重返開源，搶占開發者生態

當天壓軸登場的OpenAI則選擇以“開源”破局。該公司推出了兩款開放權重模型：gpt-oss-120b和gpt-oss-20b，標志著其時隔六年重返開源賽道。

這一步棋，OpenAI可謂精明。在閉源模型引領消費者市場后，OpenAI選擇用開源來構建更龐大的生態系統，通過降低門檻，它希望讓gpt-oss成為未來無數AI應用的基礎設施，從而在下一階段的競爭中掌握主動權。

最新發布的兩款開源大模型定位清晰：

gpt-oss-120b擁有1170億參數，每token激活51億參數，是一款為高推理能力、生產級通用場景打造的模型，可以在單張英偉達H100 GPU上高效運行；
gpt-oss-20b更具“普惠性”，總參數為210億，每token激活36億參數，專為低延遲、本地化或專業場景設計，僅需16GB內存即可在消費級筆記本電腦或手機等邊緣設備上部署。

根據OpenAI發布的技術報告，這兩款大模型均為純文本語言模型，在文本處理、代碼生成、數學問題求解等領域表現出色。尤為值得關注的是，gpt-oss-120b在多項基準測試中的表現，媲美甚至超越了專有模型o4-mini。較小的gpt-oss-20b則與o3-mini性能相當，在AIME和HealthBench等測試中表現更佳。

圖片來源：OpenAI技術報告

在技術架構上，gpt-oss模型采用了混合專家（MoE）架構，通過交替使用密集注意力和局部帶狀稀疏注意力機制，實現了高效的推理和內存利用。模型還支持高達128000個token的上下文長度，相當于約300~400頁的小說文本。

同時，模型采用了原生MXFP4量化技術，極大地降低了硬件門檻，使得開發者可以在更低的配置下運行模型。

在許可方面，gpt-oss系列模型采用了對企業友好的Apache 2.0許可協議。這意味著任何消費者、開發者或企業都可以免費下載、進行參數級微調，并將其用于商業服務或創收，而無需向OpenAI支付任何費用。

此外，模型支持本地運行，無需聯網，可以有效滿足金融、醫療、法律等對數據隱私有嚴格要求的行業需求。

還需要指出的是，OpenAI的開源并不徹底。

gpt-oss使用的是OpenAI自定義的“OpenAI Model License 1.0”，其中包含了“毒丸條款”，禁止年度收入超過1億美元或日活躍用戶超過100萬的商業實體，使用gpt-oss來開發與OpenAI核心產品競爭的服務。這一條款精準地將所有潛在的大公司競爭對手排除在外，同時又能讓廣大的中小開發者和研究者進入其生態，是一次重大的戰略轉向。