實測GPT-5 Pro:別被普通版騙了!Pro才是OpenAI真正的頂級模型
GPT-5終于來了,全世界的眼睛都盯著它。
但是目前的評價嘛,卻是毀譽參半。我們也趕緊上手深度實測了一波。
發(fā)現(xiàn)GPT-5這家伙,表現(xiàn)還真有點「飄忽不定」,猜測可能和那個叫「路由」功能有關(guān)。
但是,一旦切換到GPT-5 Pro模式,強制使用最強能力時。天吶!感覺是真的有點強。

廢話不多說。我們直接上案例,看看它到底有多牛。以下所有實測Demo均由GPT-5 Pro出品。
GPT-5 Pro實測展示
1. 首先就是喜聞樂見的「前端能力」展示
我們讓GPT-5 Pro制作了一個黑客帝國的風(fēng)格的可調(diào)參數(shù)城市,附帶一個控制面板。
不得不說,編程能力確實提升巨大。

在完整視頻中,你能看到GPT-5的參數(shù)面板非常豐富,可以調(diào)節(jié)很多細節(jié),這個直觀上就比我們以前測試的所有例子都要好。

2. 看圖求解數(shù)獨
只需要1分鐘10s中,完美解決數(shù)獨問題。


3. 比大小變體
比較9.9和9.11已經(jīng)有了變體形式,通過求解方程來進一步測試模型的推理和計算能力。

4. 時鐘難題
GPT-5 Pro一開始也是認錯的,但是只要提示詞強調(diào)「短的是時針,長的是分針」,然后Bingo!
6個鐘表5個完全正確,只有黃色時鐘識別錯誤。
不過,紅色鐘表由于時針和分針里的太近,被認為是12點(實際11點55,非常接近)


作為對比,Gemini 2.5 Pro的識別錯誤率就非常的高,幾乎全錯,多次詢問正確率依然不高。

5. IMO數(shù)學(xué)問題
IMO的問題雖然都是OpenAI和谷歌都解出來了1-5題,但是他們是用的都是特調(diào)參賽用模型。
使用GPT-5 Pro求解第一道題目,在近16分鐘的思考后,也得出了正確答案。

并且給出了非常詳細的答案。


6. GeoGuessr看圖猜地址挑戰(zhàn)
將GeoGuessr上的挑戰(zhàn),交給GPT-5 Pro。

GPT-5 Pro根據(jù)磚墻顏色、房屋風(fēng)格、交通標志、植被等全方位的分析,2min判斷這是南非。

可以進一步要求深入分析,具體經(jīng)緯度在哪里。

這是最終的結(jié)果,確實就是南非。

網(wǎng)友已玩兒嗨
網(wǎng)友們也都玩出了花!
有人在實測后認為GPT-5 Pro確實是一個頂級模型,是最優(yōu)秀的。
OpenAI在Pro版本上取得了巨大的進步!

Peter進行了12次測試。
結(jié)論是:沒有任何其他模型能夠匹敵,無論是OpenAI、Google、xAI還是Anthropic的模型。
所有這些測試都只用了 1-3 次嘗試,輸出結(jié)果確實非常出色。

沃頓商學(xué)院CS教授EthanMollick驚嘆道,自己全程沒有輸出一行代碼,就讓GPT-5做出一個建筑生成器。
只需要重復(fù)一句話——改進它,就實現(xiàn)了如下的效果。

一個提示,可以單次生成「我的世界」克隆版。


類似奧特曼制作的鼓點音樂,網(wǎng)友也嘗試了GPT-5創(chuàng)建旋律和可視化效果。

GPT-5氛圍編程,直出一個社交模擬器。

在SVG圖生成方面,GPT-5可以說達到了全新高度。
OpenAI科學(xué)家SebastienBubeck表示,「在OpenAI,團隊已前后攻克了預(yù)訓(xùn)練和推理兩大技術(shù)難題。
現(xiàn)在正在全力探索一套,能最大限度發(fā)揮兩者協(xié)同效應(yīng)的新技術(shù)體系。GPT-5僅僅是這個方向的第一步」。

GPT-5還能看圖精準定位,網(wǎng)友將童年一張照片扔給ChatGPT,沒想到它直接定位到一英里范圍內(nèi)。


硅谷爆紅經(jīng)濟學(xué)家TylerCowen認為,GPT-5在專業(yè)領(lǐng)域表現(xiàn)遠超o3,并稱這是自己用過最出色的學(xué)習(xí)工具。

同樣,在編程方面,OpenAI研究員SuvanshSanjeev表示,「GPT-5重新定義并拓展了不同規(guī)模模型的成本和智能邊界」。

可以說。正如METR最新報告所指出的,AI的指數(shù)級增長仍未放緩。

GPT-5完成任務(wù)時長延伸了52%
GPT-5提示指南
各路大神都進行了實測,但是要想自己玩得好,還要看官方指南。
OpenAI自己出了官方指導(dǎo)手冊「GPT-5 prompting guide」。

指南基于官方團隊與早期測試者(如Cursor)的實踐經(jīng)驗,總結(jié)了在不同場景下提升GPT-5輸出質(zhì)量的提示策略,涵蓋智能體主動性調(diào)控、上下文收集優(yōu)化、Responses API 的高效利用,以及在前端/全棧開發(fā)中的最佳實踐。
OpenAI表示他們從規(guī)劃到執(zhí)行,盡可能的最大化編碼性能。
比如前端開發(fā),GPT-5 在訓(xùn)練中具備了出色的基準審美品味,同時擁有嚴謹?shù)膶崿F(xiàn)能力。
對于新應(yīng)用,OpenAI建議使用以下框架和包,以最大程度地發(fā)揮該模型在前端方面的能力:
- 框架:Next.js(TypeScript)、React、HTML
- 樣式/UI:Tailwind CSS,shadcn/ui,Radix 主題
- 圖標:Material Symbols、Heroicons、Lucide
- 動畫: Motion
- 字體:San Serif、Inter、Geist、Mona Sans、IBM Plex Sans、Manrope
并且網(wǎng)友們也整了一套GPT-5的提示詞范例。比如
1.深度推理與問題解決(Deep Reasoning & Problem-Solving)
先把問題拆解成清晰步驟,再輸出答案,減少推理錯誤。
2.先批評再定稿模式(Critique Before Final Mode)
先完成初稿,再讓GPT-5批評并修改,提升質(zhì)量。
3.角色+目標+約束(Role + Objective + Constraints)
設(shè)定身份、目標和嚴格約束,讓輸出更貼合需求。
4.逐步加深(Progressive Deepening)
先給高層概述,再逐步深入細節(jié),避免一次性信息過載。

彩蛋
被網(wǎng)友催的狠了,現(xiàn)在OpenAI已經(jīng)把GPT-5之前的所有模型都放了出來。
快去看看你的ChatGPT里是否已經(jīng)有了。

方法是進入設(shè)置并打開「顯示傳統(tǒng)模型」,就能在下拉菜單中看到之前的模型了。

同時,你也可以選擇將顏色設(shè)置尊貴的「黑色」。






































