GPT-5實(shí)錘,悄悄上線代號「龍蝦」!版本號曝光,實(shí)測編程驚人能改屎山代碼
GPT-5來了?但是「龍蝦」版!
GPT-5「Lobster」疑似現(xiàn)身WebDev Arena,引發(fā)社區(qū)狂熱猜測:網(wǎng)友實(shí)測比Grok-4好的離譜。
WebDev Arena是一個大模型能力匿名評測的網(wǎng)站,使用相同的提示詞,在雙盲的情況下,給你認(rèn)為最好的模型投票。
很多待發(fā)布的模型,都會有各種各樣「奇怪」的代號提前進(jìn)行實(shí)測。

Lisan al Gaib在實(shí)測中捕捉了GPT-5!
并且用同樣的提示詞,GPT-5生成的頁面效果非常驚艷(左邊是GPT-5,右邊Grok-4)。

他使用的提示詞是:
Create a stunning, interactive animation of a neural network or brain-like graph structure—use artistic colors, smooth transitions, and beautiful visuals. The page should feel alive, immersive, and impressive, with no buttons—just scrolling or continuous animation. Make it breathtaking.
創(chuàng)建一個令人驚嘆的神經(jīng)網(wǎng)絡(luò)或類腦圖結(jié)構(gòu)的交互式動畫——使用藝術(shù)性的色彩、平滑的過渡和精美的視覺效果。整個頁面應(yīng)充滿活力、沉浸感和震撼力,不使用任何按鈕,僅通過滾動或持續(xù)的動畫進(jìn)行交互。讓其令人嘆為觀止。
疑似GPT-5,并且命名為「龍蝦」的LLM給出了驚艷的答案。

此外,GPT-5其他版本的代號也疑似曝光。
- GPT-5:Lobster
- GPT-5-mini:Nectarine
- GPT-5-nano:Starfish

多位用戶表示該模型在代碼生成、交互表現(xiàn)上已超越Claude,令他們震驚。
與此同時,Reddit網(wǎng)友發(fā)現(xiàn),OpenAI現(xiàn)在正在將所有o3請求秘密地轉(zhuǎn)接到GPT-5上處理。(LMArena中新的匿名 OpenAI模型「zenith」,所以O(shè)penAI為了測試GPT-5到底起了多少「外號」?)
它現(xiàn)在能夠處理o3在「正確/接近正確的解答率」只有0%的極高難度數(shù)學(xué)問題,并且在風(fēng)格上與o3有顯著不同。


甚至,有網(wǎng)友表示,已經(jīng)有非科技行業(yè)的員工已經(jīng)獲得了GPT-5預(yù)覽版的訪問權(quán)限。
但可能由于保密協(xié)議的關(guān)系,無法知曉到底是哪家公司能這么幸運(yùn)被隨機(jī)選中。

看來GPT-5已經(jīng)是箭在弦上了!
GPT-5搶先體驗(yàn):實(shí)錘了,很強(qiáng)
顯然,如今GPT-5如今已經(jīng)近在咫尺。
比如OpenAI CEO奧特曼,就已經(jīng)開始在各個場合暗戳戳地宣揚(yáng)這個強(qiáng)大的神秘模型。
在最近的一次采訪中,他這樣描述了自己對GPT-5的使用初體驗(yàn)。
「那一刻,我癱坐在椅子上,唯一的感覺就是震撼——天吶,這就是未來!」

與此同時,AI圈也按捺不住地躁動起來。已經(jīng)有多位提前體驗(yàn)GPT-5的用戶出來透露說,GPT-5的表現(xiàn)極其驚艷!
不過,目前我們尚未得知,GPT-5究竟會在何時發(fā)布,會提供給哪些客戶。
據(jù)悉,GPT-5旨在實(shí)現(xiàn)奧特曼的一項(xiàng)計劃:將傳統(tǒng)的GPT系列大模型與o系列推理模型,整合進(jìn)一個統(tǒng)一的模型界面中。
現(xiàn)在,外媒已經(jīng)為我們收集了一波體驗(yàn)者的感想。
簡單來說就是——
在自然科學(xué)領(lǐng)域,推理更深入;
在瀏覽器里自動完成復(fù)雜任務(wù);
寫作更流暢,邏輯更在線;
更重要的是:在編碼上有炸裂提升!
GPT-5跟Anthropic的混合式Claude模型類似。在未來,用戶或許能控制GPT-5對特定問題思考的深度,模型自身也會根據(jù)問題的難易度,自動開啟或關(guān)閉推理能力。
也就是說,如果我們?nèi)枴竤trawberry里有幾個r」這種問題,即使我們要求,它也不會傻到去耗費(fèi)巨額算力來思考。
如果你問它「怎么優(yōu)化一個10年沒動的數(shù)據(jù)庫結(jié)構(gòu)」,它才開始認(rèn)真調(diào)用深層邏輯能力。
但其中一位體驗(yàn)者表示,GPT-5最顯著的進(jìn)步,就體現(xiàn)在編程上!
程序員哭了:屎山代碼有救了?
根據(jù)他的說法,GPT-5不僅更善于解決學(xué)術(shù)和編程競賽問題上,甚至在處理現(xiàn)實(shí)世界工程師面對的實(shí)際編程任務(wù)時,表現(xiàn)都更加驚艷了。
比如那種包含大量屎山遺留代碼的龐雜代碼庫,它能都能進(jìn)行修改,完全沒在怕的。
正是這種處理復(fù)雜場景的細(xì)致能力,讓OpenAI的模型過去始終落后于Anthropic。畢竟在開發(fā)者群體中,大家都公認(rèn),Claude才是真正的編程王者。
一位體驗(yàn)者親測后表示,GPT-5在編程上,甚至直接勝過了Anthropic的Claude Sonnet 4!
因此,我們可以直接窺見OpenAI在自動化復(fù)雜編程上的野心了。
畢竟,目前市面上最能賺錢的AI產(chǎn)品之一就是編程助手,像Cursor就靠Claude賺得盆滿缽滿,據(jù)說年?duì)I收都達(dá)到上億美元了。

顯然,OpenAI很想把這塊大蛋糕搶回來。
不僅如此,在OpenAI領(lǐng)導(dǎo)層的眼里,是否能自動化真實(shí)世界的復(fù)雜編程任務(wù),就是實(shí)現(xiàn)AGI的關(guān)鍵。
安撫英偉達(dá)和投資人
總之,如果GPT-5表現(xiàn)強(qiáng)勁,對于英偉達(dá)、數(shù)據(jù)中心建設(shè)公司和投資者而言,都能起到很好的安撫作用。
畢竟在去年,曾有一波大模型撞墻論曝出。
而GPT-5的好消息,就意味著即使預(yù)訓(xùn)練的邊際收益遞減也沒關(guān)系,因?yàn)樘嵘鼳I模型能力的真正關(guān)鍵,就在于后訓(xùn)練階段的強(qiáng)化學(xué)習(xí)。
也就是說,OpenAI的路線沒有撞墻,只是換道超車了!
另外還有個細(xì)節(jié),此次更加被證實(shí)。

此前就有很多人猜測,GPT-5可能不是一個統(tǒng)一的模型,而是一個路由器機(jī)制。
它會根據(jù)問題的類型,把你的提問發(fā)送給一個擅長閑聊GPT大模型,或是一個擅長邏輯和推理的o系列模型。
最終我們所看到的GPT-5的表現(xiàn),就是這倆模型組合拳的效果。
彩蛋:GPT-8都在路上了?
甚至這次,還有投資人爆料,OpenAI高管曾私下說——
我們在不換架構(gòu)的前提下,有信心做到GPT-8。
這可實(shí)在太猛了。雖然聽起來像是「PPT先行」,但也傳遞出一個關(guān)鍵信息。
OpenAI并沒有打算卷新架構(gòu),而是靠更聰明的調(diào)度、更強(qiáng)的推理、更多的后訓(xùn)練數(shù)據(jù),一步一步把現(xiàn)有技術(shù)用到極致。
所以,照例每日一問:GPT-5啥時候來?



































