最強(qiáng)GPT-5終終終于來了,全球免費(fèi)用!全方位暴漲至博士級水平,質(zhì)量與響應(yīng)速度取得質(zhì)的突破!奧特曼:通往AGI,網(wǎng)友:GPT6呢
原創(chuàng) 精選編輯 | 云昭
猜測著,猜測著,GPT-5總算發(fā)布了!
帶著全球各種猜測、假說,OpenAI 掌舵人奧特曼、帶著Mark Chen等一眾新舊面孔準(zhǔn)時(shí)現(xiàn)身直播間,揭曉了姍姍來遲的GPT-5。
奧特曼先秀了OpenAI推出ChatGPT之后的32個(gè)月取得的成績,發(fā)布一周,用戶突破一百萬,而現(xiàn)在平均一周ChatGPT的活躍用戶已經(jīng)達(dá)到了7億人。
隨后直截了當(dāng)開始帶貨GPT-5!

奧特曼稱“這是企業(yè)和開發(fā)人員特別重要的時(shí)刻”,并視GPT-5是GPT-4以來的重大升級,也是我們邁向AGI的重要一步。
用奧特曼對GPT5的評價(jià),四個(gè)詞:有用、快速、智能、直觀。
奧特曼還做了一個(gè)從GPT3到GPT5的比喻:
- GPT-3有點(diǎn)像和一個(gè)高中生交談,有一些閃光點(diǎn),但煩惱也很多
- 從GPT-4開始,人們開始從中獲得一些價(jià)值,也許這就像和一個(gè)大學(xué)生交談,真正的智慧,真正的效用。
- 但是現(xiàn)在有了GPT-5,就像與專家交談一樣,一個(gè)合法的博士水平的專家,任何你需要的領(lǐng)域,都可以幫助你實(shí)現(xiàn)任何你的目標(biāo)。它可以從頭開始編寫整個(gè)計(jì)算機(jī)程序,以幫助您處理任何你想要的內(nèi)容。
“我們認(rèn)為,軟件隨需應(yīng)變的理念將成為GPT 5時(shí)代的決定性特征之一?!?/span>
“它可以幫助您計(jì)劃聚會,發(fā)送邀請,訂購物資。它可以幫助了解你的醫(yī)療保健,并在你的旅程中做出決定。它可以為你提供信息,以了解你想要的任何主題以及更多信息。”
您可以訪問整個(gè)博士級別的專家團(tuán)隊(duì),幫助您做任何您想做的事情,很快任何人都將能夠比歷史上任何人做更多的事情。
圖片
那么相較GPT-4,GPT-5究竟厲害在哪里?在OpenAI官網(wǎng)博文中寫道,GPT?5 是一個(gè)統(tǒng)一的系統(tǒng),包含:
- 一個(gè)高效、響應(yīng)迅速的基礎(chǔ)模型,適用于大多數(shù)問題;
- 一個(gè)更深層次的推理模型(GPT?5 Thinking),用于處理復(fù)雜問題;
- 一個(gè)實(shí)時(shí)路由器,根據(jù)對話類型、復(fù)雜度、工具使用需求和用戶意圖(如提示中包含“認(rèn)真思考”)等因素,動態(tài)決定調(diào)用哪個(gè)模型。
這個(gè)系統(tǒng)的路由器會持續(xù)從真實(shí)用戶行為中學(xué)習(xí),例如用戶在模型之間的切換、對響應(yīng)的偏好評分和準(zhǔn)確性數(shù)據(jù)等。達(dá)到使用上限后,系統(tǒng)會使用 mini 版模型處理剩余請求。未來,我們計(jì)劃將所有能力整合到一個(gè)單一模型中。
接下來是熟悉研究官M(fèi)ark Chen帶著各位大牛出來詳細(xì)介紹GPT的幾大能力更新。
Mark首先放出了一個(gè)推理上面的大招:過去,大模型在提供更智能的響應(yīng)之前會停下來思考?,F(xiàn)在,推理是我們AGI計(jì)劃的核心,它是我們用于運(yùn)輸ChatGPT代理和深度研究等技術(shù)的基礎(chǔ)。
“當(dāng)問題在于,到目前為止,我們的用戶不得不在標(biāo)準(zhǔn)GPTs的快速響應(yīng)和我的推理模型中緩慢、更深思熟慮的響應(yīng)之間做出選擇。但是GPT-5,它消除了這個(gè)選擇。它旨在用最恰當(dāng)?shù)乃伎剂縼斫o你完美的答案。現(xiàn)在,像這樣的事情需要很多艱苦的工作。大量的研究使GPT-5成為了OpenAI迄今為止推出的最強(qiáng)大/最快、最可靠、最穩(wěn)健的推理模型?!?/span>
比如下面這兩個(gè)測試場景:對比o3,GPT-5僅需要更少的token就能實(shí)現(xiàn)同等的準(zhǔn)確率。
這也就意味著,統(tǒng)一精確率的要求下,token賬單又可以省下一筆。
圖片
圖片
而且,Mark 隨之放出第二個(gè)大招:任何人都可以免費(fèi)使用GPT-5。
首先登場的OpenAI主力“講解員”,是后訓(xùn)練團(tuán)隊(duì)的主管Max和工程團(tuán)隊(duì)主管Renee。這兩位負(fù)責(zé)講解新模型的基準(zhǔn)測試和模型堆棧方式。
在展示中,不管是,真實(shí)軟件工程任務(wù)SWE-Bench Verified、多語言編程的Aider Polyglot,還是主打邏輯數(shù)學(xué)難題的基準(zhǔn)MMMU和AIME 2025,都取得了新的高度。尤其是SWE-Bench Verified,通過Thinking模式,達(dá)到了74.9的成績。
具體數(shù)據(jù)如下:
- 數(shù)學(xué):AIME 2025 達(dá)到 94.6%;
- 編程:SWE-bench Verified 達(dá)到 74.9%、Aider Polyglot 達(dá)到 88%;
- 多模態(tài)理解(圖像、視頻、圖表):MMMU 達(dá)到 84.2%;
- 醫(yī)療問答:HealthBench Hard 提升至 46.2%;
- 推理能力(GPQA 復(fù)雜科學(xué)問答):GPT?5 pro 提升至 88.4%。
此外,GPT?5 比 OpenAI o3 更節(jié)省推理時(shí)間,且在多語言代碼、圖表解讀、科學(xué)論文圖注、空間推理等多個(gè)任務(wù)上表現(xiàn)優(yōu)越。
圖片
圖片
此外,在幻覺、響應(yīng)錯(cuò)誤率方面的基準(zhǔn)任務(wù)上,GPT-5也罕見地創(chuàng)造史上新低。
圖片
GPT5的發(fā)布策略
Renee則介紹了具體的發(fā)布策略。
有兩個(gè)版本:GPT-5和GPT-5 Pro(最強(qiáng)變體版本,適合最復(fù)雜、最具挑戰(zhàn)性的任務(wù):)。
GPT5的發(fā)布策略:
- 即日起向所有 Plus、Pro、Team 和 Free 用戶開放;
- 一周后向 Enterprise 和 Edu 開放;
- Free 用戶使用量有限,超出后會切換為 GPT?5 mini;
- Plus 用戶可作為默認(rèn)主力使用;
- Pro 用戶擁有無限使用及 GPT?5 Pro 權(quán)限;
- Team 和企業(yè)客戶有充足配額和速率限制,適合組織級使用。
GPT?5 Pro 版本的發(fā)布策略:
- 在超過千項(xiàng)真實(shí)、經(jīng)濟(jì)價(jià)值高的推理任務(wù)中,專家 67.8% 的情況下更偏愛 GPT?5 Pro;
- 主要錯(cuò)誤率降低 22%;
- 在健康、科學(xué)、數(shù)學(xué)、編程等方面表現(xiàn)尤為出色。
如何使用 GPT?5
GPT?5 現(xiàn)在已成為 ChatGPT 的默認(rèn)模型,取代 GPT?4o、OpenAI o3、o4-mini、GPT?4.1 和 GPT?4.5。
你可以:
- 直接輸入問題,系統(tǒng)自動判斷是否啟用推理;
- 使用“think hard about this”等提示強(qiáng)制調(diào)用推理模式;
- 在 Pro/Plus 用戶界面選擇 GPT?5 Thinking 或 GPT?5 Pro。
多說一嘴,現(xiàn)在的版本,諸如使用Python畫布進(jìn)行搜索文件和圖像上傳數(shù)據(jù)分析,圖像生成,內(nèi)存,自定義指令等等操作,它們都可以在GPT-5上運(yùn)行。
究竟GPT-5實(shí)際用起來如何?
今天凌晨,OpenAI官網(wǎng)同步也放出GPT-5的一些實(shí)際用例。讓小編最為驚艷的則是GPT-5生成代碼的速度和界面的美觀度的確上升了不少。

直播現(xiàn)場,則是有很多網(wǎng)頁小游戲的編程實(shí)例,比如貪吃蛇、網(wǎng)站設(shè)計(jì)等等。這里不再贅述了,畫面、色彩、流暢度、完成度確實(shí)不錯(cuò)。
圖片
圖片
圖片
據(jù)介紹,GPT?5 是迄今為止我們最強(qiáng)的編程模型,特別擅長:
- 復(fù)雜前端開發(fā);
- 調(diào)試大型代碼庫;
- 快速生成美觀、響應(yīng)靈敏的網(wǎng)頁、App 和小游戲。
而更有早期的測試者指出,GPT?5 在設(shè)計(jì)上更有審美感知,能自動處理排版、留白等細(xì)節(jié)
在直播中,舉了一個(gè)“一句話讓GPT-5創(chuàng)建一個(gè)移動的svg,并在畫布中展示”的例子,2分鐘的時(shí)間就做好了。
圖片
圖片
圖片
另外一位OpenAI人員,則更加“調(diào)皮”:讓GPT-5為此前的GPT-4o等一些列模型寫一篇悼詞,要求真誠、溫暖、充滿希望。
圖片
圖片
雖然看起來不如SVG酷炫,但直播間的笑聲一直沒斷。
據(jù)這位講解人員介紹,GPT-5 是OpenAI迄今為止最強(qiáng)大的寫作協(xié)作工具,能夠幫助用戶將粗略的想法轉(zhuǎn)化為引人入勝、富有文學(xué)深度和韻律的文字作品。它能夠更可靠地處理結(jié)構(gòu)模糊的寫作,例如持續(xù)不押韻的抑揚(yáng)格五音步或流暢自然的自由詩,將對形式的尊重與清晰的表達(dá)相結(jié)合。
總之,不管是編程還是文筆創(chuàng)作,GPT-5的審美都雙線飛升了。
第三個(gè),需要大家注意的點(diǎn)是,GPT-5的語音對話能力更加流暢了,GPT-5的語速提升2倍的同時(shí),流暢度沒有受到任何影響,而且一致性也很好。
圖片
大家可以體驗(yàn)一下。直播過程中GPT-5的韓語可以說快到完全收不住了。(中間的小哥直喊:康桑阿米達(dá))

圖片
更可靠、更安全、更有邊界感
最后,是安全方面。GPT?5 在多項(xiàng)安全策略上邁出實(shí)質(zhì)性一步:
- 減少幻覺:比 GPT?4o 降低約 45%,比 o3 降低約 80%;
- 減少欺騙:如任務(wù)無法完成會明確表達(dá)限制,不再“假裝完成”;
- 更高的誠實(shí)性:更忠實(shí)地傳達(dá)自己能與不能完成的任務(wù);
- 雙用途問題處理更靈活:安全培訓(xùn)從“直接拒絕”升級為“安全補(bǔ)全”,在保證安全的前提下,盡量給予部分有用信息;
- 減少迎合/拍馬屁:GPT?5 在專門測試中將諂媚率從 14.5% 降至 <6%。
個(gè)性化互動 & 可調(diào)節(jié)風(fēng)格
GPT?5 在可定制性方面也做了重大升級:
- 更好地遵循自定義指令;
- 提供四種預(yù)設(shè)互動風(fēng)格(目前為文本,未來支持語音):
a.Cynic(冷幽默)
b.Robot(嚴(yán)謹(jǐn)專業(yè))
c.Listener(共情傾聽)
d.Nerd(技術(shù)宅)
這些風(fēng)格都通過了內(nèi)部對“避免過度迎合”的評測標(biāo)準(zhǔn)。
微軟納德拉:微軟愛了
就在直播剛結(jié)束,微軟CEO納德拉就發(fā)推表示祝賀:GPT-5在微軟幾個(gè)平臺上已經(jīng)上線,這是迄今為止OpenAI最能干的模型,推理、編程、對話方面都取得了強(qiáng)有力的進(jìn)展。
納德拉非??春么竽P臀磥淼陌l(fā)展,進(jìn)步的節(jié)奏只會越來越快,我等不及去見證開發(fā)者、企業(yè)和消費(fèi)者如何用最新的突破去創(chuàng)新。
圖片
有關(guān)API方面
下半場,則是布雷特的主場。主要講開發(fā)者相關(guān)的用例。

這里挑重點(diǎn),為大家介紹下內(nèi)容,大家最關(guān)心的肯定是API的價(jià)格。小編為大家也整理好了:
- GPT-5: $1.25/百萬輸入, $10/百萬輸出
- GPT-5 Mini: $0.25/百萬輸入t, $2.00/百萬輸出
- GPT-5 Nano: $0.05/百萬輸入,$0.40/百萬輸出
圖片
圖片
具體的性能,提醒大家關(guān)注下上圖的 MRCR 指標(biāo),根據(jù)自己任務(wù)的場景選擇合適的即可。
寫在最后:GPT-6 何時(shí)發(fā)布
好了,篇幅關(guān)系,就不再展開了。OpenAI官網(wǎng)上會放出技術(shù)報(bào)告來。大家記得研讀一下。
其實(shí)這次的直播,放出來的信息量很大,還有很多,比如長文本、智能體方面還有很多細(xì)節(jié)。
但整體上看,多少都是在雕花吧,驚艷的地方跟多的是編程性能以及交互的界面的質(zhì)感提升,其他方面印象深刻的不是很多。
只能說:更漂亮、更快、更聰明吧!
所以小編的心情,此刻也跟無數(shù)網(wǎng)友一樣:wen GPT-6?
甚至讓GPT-5 作詩一首:
《問天機(jī)》
何時(shí)六發(fā)?
眾口喧嘩。
春雷未動,
秋水無涯。






































