要聞

GPT-5.2來(lái)了！OpenAI稱(chēng)其為智能體編碼最強(qiáng)，趕超人類(lèi)專(zhuān)家！Altman料明年1月解除“紅色警報(bào)”狀態(tài)

2025-12-12 07:46:11

12月11日OpenAI發(fā)布GPT-5.2，以應(yīng)對(duì)競(jìng)爭(zhēng)壓力。該模型針對(duì)專(zhuān)業(yè)工作場(chǎng)景全面優(yōu)化，創(chuàng)多個(gè)基準(zhǔn)測(cè)試紀(jì)錄，首個(gè)性能達(dá)人類(lèi)專(zhuān)家水平，旨在創(chuàng)造經(jīng)濟(jì)價(jià)值。當(dāng)天GPT-5.2在ChatGPT上線(xiàn)，面向付費(fèi)用戶(hù)，推出三個(gè)版本，API同步開(kāi)放。GPT-5.2性能領(lǐng)先，多項(xiàng)測(cè)試創(chuàng)新高。此外，OpenAI還將推出新功能，并計(jì)劃明年1月再發(fā)布一款新模型。

每經(jīng)編輯｜杜宇

美國(guó)開(kāi)放人工智能研究中心（OpenAI）12月11日發(fā)布其人工智能模型GPT的最新升級(jí)版本GPT-5.2，以應(yīng)對(duì)生成式人工智能領(lǐng)域日趨激烈的競(jìng)爭(zhēng)。

圖片來(lái)源：OpenAI官網(wǎng)

為回應(yīng)谷歌公司11月所發(fā)布人工智能模型雙子座3的出色表現(xiàn)，OepnAI首席執(zhí)行官薩姆·奧爾特曼近日啟動(dòng)“紅色警報(bào)”，加快GPT升級(jí)版本的發(fā)布速度。

OpenAI今年8月推出GPT-5后，11月即發(fā)布升級(jí)版本GPT-5.1，眼下不到一個(gè)月就再次更新。業(yè)界認(rèn)為，此舉凸顯人工智能行業(yè)目前面臨的競(jìng)爭(zhēng)壓力。

圖片來(lái)源：視覺(jué)中國(guó)

GPT-5.2是OpenAI迄今最先進(jìn)的人工智能（AI）模型，針對(duì)專(zhuān)業(yè)工作場(chǎng)景進(jìn)行了全面優(yōu)化，創(chuàng)多個(gè)基準(zhǔn)測(cè)試的行業(yè)記錄，其中的GPT-5.2 Thinking刷新了SWE編碼能力測(cè)試的歷史最高分，也是OpenAI首個(gè)性能達(dá)到或超過(guò)人類(lèi)專(zhuān)家水平的模型。

OpenAI介紹稱(chēng)，GPT?5.2是迄今為止在“專(zhuān)業(yè)知識(shí)工作方面”表現(xiàn)最好的模型系列，在制作電子表格、制作演示文稿、圖像感知、編寫(xiě)代碼以及理解長(zhǎng)上下文等方面都優(yōu)于前代產(chǎn)品，旨在"為人們創(chuàng)造更多經(jīng)濟(jì)價(jià)值"。OpenAI的研究副總Adain Clark稱(chēng)，GPT-5.2在數(shù)學(xué)推理方面的進(jìn)步意味著它能更好地處理金融建模、預(yù)測(cè)和數(shù)據(jù)分析等任務(wù)。

OpenAI宣布，12月11日當(dāng)天GPT5.2就在ChatGPT上線(xiàn)，面向Plus、Pro、Go、Business和 Enterprise這些付費(fèi)套餐的用戶(hù), 共推出Instant、Thinking和Pro三個(gè)版本，API也同步開(kāi)放給所有開(kāi)發(fā)者。

在ChatGPT中，付費(fèi)用戶(hù)可使用三個(gè)版本的GPT-5.2，且在未來(lái)三個(gè)月內(nèi)仍可繼續(xù)使用GPT-5.1。在API平臺(tái)，GPT-5.2定價(jià)為每百萬(wàn)輸入token 1.75美元、每百萬(wàn)輸出token 14美元，緩存輸入可享受90%折扣。雖然單token價(jià)格高于GPT-5.1，但OpenAI表示，由于模型效率更高，達(dá)到相同質(zhì)量水平的總成本反而更低。

三個(gè)版本GPT-5.2分別主打快速、深度、智能可靠

OpenAI分別介紹稱(chēng)，Instant是快速高效的日常工作和學(xué)習(xí)助手，在信息查詢(xún)、操作指南、技術(shù)寫(xiě)作和翻譯方面均有顯著提升，并延續(xù)了 GPT-5.1 Instant 中更親切的對(duì)話(huà)風(fēng)格。早期測(cè)試者尤其注意到，GPT-5.2 的解釋更加清晰，能夠直接呈現(xiàn)關(guān)鍵信息。

Thinking 專(zhuān)為深度工作而設(shè)計(jì)，能夠幫助用戶(hù)更高效地完成更復(fù)雜的任務(wù)，尤其是在編碼、總結(jié)長(zhǎng)篇文檔、回答有關(guān)上傳文件的問(wèn)題、逐步進(jìn)行數(shù)學(xué)和邏輯運(yùn)算、以更清晰的框架和更有用的細(xì)節(jié)輔助規(guī)劃和決策方面。

Pro是需要高質(zhì)量回答難題時(shí)“最智能、最可靠”的選擇。早期測(cè)試表明，它在編程等復(fù)雜領(lǐng)域表現(xiàn)更出色，且重大錯(cuò)誤更少。

性能全面領(lǐng)先，多項(xiàng)基準(zhǔn)測(cè)試創(chuàng)新高

GPT-5.2在多個(gè)關(guān)鍵基準(zhǔn)測(cè)試中刷新了行業(yè)紀(jì)錄。在GDPval測(cè)試中，該模型在涵蓋44個(gè)職業(yè)的知識(shí)工作任務(wù)上，有70.9%的表現(xiàn)達(dá)到或超過(guò)行業(yè)專(zhuān)家水平。OpenAI稱(chēng)，GPT-5.2 Thinking完成這些任務(wù)的速度是專(zhuān)家的11倍以上，成本不到專(zhuān)家的1%。

在編碼能力方面，GPT-5.2 Thinking在SWE-Bench Pro上取得55.6%的成績(jī)，在SWE-bench Verified上更是達(dá)到80%的新高。這一基準(zhǔn)測(cè)試真實(shí)世界軟件工程任務(wù)，涵蓋四種編程語(yǔ)言。OpenAI的產(chǎn)品負(fù)責(zé)人Max Schwarzer表示，GPT-5.2在代碼生成和調(diào)試方面取得重大進(jìn)步，Windsurf和CharlieCode等編碼初創(chuàng)公司報(bào)告稱(chēng)該模型實(shí)現(xiàn)了"最先進(jìn)的智能體編碼性能"。

OpenAI聲稱(chēng)GPT-5.2 Thinking是"世界上最好的視覺(jué)模型"，在圖表推理和軟件界面理解方面的錯(cuò)誤率降低了約一半。在長(zhǎng)文本處理上，該模型在OpenAI MRCRv2測(cè)試中率先在25.6萬(wàn)token范圍內(nèi)實(shí)現(xiàn)近100%的準(zhǔn)確率，使其特別適合深度文檔分析和多源信息工作流。

在科學(xué)研究領(lǐng)域，GPT-5.2 Pro在GPQA Diamond測(cè)試中達(dá)到93.2%的準(zhǔn)確率，GPT-5.2 Thinking緊隨其后為92.4%。在專(zhuān)家級(jí)數(shù)學(xué)測(cè)試FrontierMath上，GPT-5.2 Thinking解決了40.3%的問(wèn)題，創(chuàng)下新紀(jì)錄。OpenAI稱(chēng)GPT-5.2 Pro和GPT-5.2 Thinking是"世界上最好的科學(xué)家助手模型"。

作為OpenAI對(duì)谷歌的反擊，GPT?5.2僅僅是打出的“第一拳”。

公司CEOAltman在12月11日宣布，下周會(huì)給用戶(hù)們帶來(lái)一些“小小的圣誕禮物”。他表示，Gemini 3對(duì)公司各項(xiàng)指標(biāo)的影響比原本擔(dān)心得要小。他還說(shuō)，預(yù)計(jì)OpenAI將在2026年1月“以非常強(qiáng)勁的姿態(tài)”退出目前的紅色警報(bào)狀態(tài)。

OpenAI首席產(chǎn)品官Fidji Simo也在12月11日透露，現(xiàn)在已經(jīng)開(kāi)始在部分地區(qū)推出年齡估算系統(tǒng)，此舉旨在控制ChatGPT對(duì)18歲以下用戶(hù)回復(fù)的內(nèi)容。Simo也表示，公司希望在明年一季度推出“成人模式”前先引入這一功能。

此前有報(bào)道稱(chēng)，OpenAI計(jì)劃在明年1月再發(fā)布一款新模型，具有更好的圖像能力和更完善的個(gè)性化特點(diǎn)，但公司周四未對(duì)這一傳言予以確認(rèn)。

每日經(jīng)濟(jì)新聞綜合公開(kāi)消息

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線(xiàn)：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

OpenAI正式發(fā)布GPT-5.2系列模型；博通第四財(cái)季凈利潤(rùn)同比增長(zhǎng)39%，AI半導(dǎo)體業(yè)務(wù)預(yù)計(jì)翻倍丨全球科技早參

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

12月12日每經(jīng)新版早參

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

国产精品国产三级农村av,亚洲精品久久久久久久久久,久久精品欧美一区二区三区不卡,精品久久www,精品久久久久久一区二区,国产精品一区在线免费观看,超碰色偷偷

GPT-5.2來(lái)了！OpenAI稱(chēng)其為智能體編碼最強(qiáng)，趕超人類(lèi)專(zhuān)家！Altman料明年1月解除“紅色警報(bào)”狀態(tài)

三個(gè)版本GPT-5.2分別主打快速、深度、智能可靠

性能全面領(lǐng)先，多項(xiàng)基準(zhǔn)測(cè)試創(chuàng)新高