GPT-5編程專用版發(fā)布!獨立連續(xù)編程7小時,簡單任務(wù)提速10倍,VS Code就能用
OpenAI Codex編程智能體大升級:
推出GPT-5-Codex特化版模型,支持獨立連續(xù)編程7個小時。
還有IDE插件版,在VS Code、Cursor中都可以使用Codex了。

新模型最牛的地方在于“真·動態(tài)思考”能力。
與GPT-5任務(wù)一開始就決定用多少算力的“路由機制”不同,GPT-5-Codex能在執(zhí)行任務(wù)的過程中實時調(diào)整,可能在處理一個問題5分鐘后,AI突然意識到還需要再花一個小時。
在測試中,OpenAI團(tuán)隊見證了GPT-5-Codex為了完成復(fù)雜任務(wù),獨立工作超過7小時,期間不斷迭代實現(xiàn)、修復(fù)測試失敗,最終成功交付。
早期測試用戶Dan Shipper表示體驗好多了,現(xiàn)在可以進(jìn)行連續(xù)對話,像“我們在哪個目錄?”這樣簡單的問題可以立即得到結(jié)果,而不是每輪對話都要等AI思考幾分鐘。

GPT-5編程專用版
首先來看變成專用版模型GPT-5-Codex。
它針對復(fù)雜的實際工程任務(wù)進(jìn)行訓(xùn)練,包括從頭構(gòu)建完整項目、添加功能和測試、調(diào)試、執(zhí)行大規(guī)模重構(gòu)。
在SWE-bench Verified上的表現(xiàn)略優(yōu)于原版GPT-5,在代碼重構(gòu)任務(wù)的成功率直接提升近20%。

新的動態(tài)思考能力體現(xiàn)在數(shù)據(jù)上更加直觀,根據(jù)OpenAI員工內(nèi)部使用情況統(tǒng)計:
對于簡單任務(wù),GPT-5-Codex輸出token數(shù)比GPT-5減少了93.7%,也就是簡單任務(wù)響應(yīng)提速10倍。
對于復(fù)雜任務(wù),它會花兩倍的時間進(jìn)行推理、編輯和測試代碼,輸出token量增加102.2%。

GPT-5-Codex還經(jīng)過了專門的代碼審查訓(xùn)練。在審查流行開源項目的最新PR時,錯誤評論率從13.7%降到了4.4%,高影響力評論的比例從39.4%提升到52.4%。它能理解PR的真實意圖,遍歷整個代碼庫和依賴關(guān)系,甚至運行代碼和測試來驗證行為。

在OpenAI內(nèi)部,Codex已經(jīng)審查了絕大多數(shù)PR,每天能發(fā)現(xiàn)數(shù)百個問題。
全方位升級的Codex生態(tài)
這次更新不只是模型升級那么簡單,OpenAI直接重構(gòu)了整個Codex產(chǎn)品體系,重構(gòu)后的Codex CLI現(xiàn)在支持圖像輸入,可以直接把截圖、線框圖、設(shè)計稿扔給它,讓它照著實現(xiàn)。
在處理復(fù)雜任務(wù)時,Codex會用待辦事項列表追蹤進(jìn)度,還集成了網(wǎng)絡(luò)搜索和MCP等工具。
終端界面也做了升級,現(xiàn)在工具調(diào)用和diff展示更清晰。
審批模式簡化為三個級別:只讀模式需要明確批準(zhǔn)、自動模式在工作區(qū)內(nèi)有完全訪問權(quán)限但工作區(qū)外需要批準(zhǔn)、完全訪問模式可以讀取任何文件并執(zhí)行帶網(wǎng)絡(luò)訪問的命令。

新推出的IDE擴(kuò)展把Codex直接帶進(jìn)了VS Code、Cursor等編輯器。還支持云端和本地?zé)o縫切換,可以在IDE里創(chuàng)建云任務(wù)、跟蹤進(jìn)展、審查完成的工作,所有上下文信息都能保持。
需要做最后修改時,可以把云任務(wù)拉到本地IDE,Codex依然記得之前的所有信息。

背后是云端基礎(chǔ)設(shè)施的性能提升。
通過容器緩存技術(shù),新任務(wù)和后續(xù)任務(wù)的中位完成時間縮短了90%。Codex現(xiàn)在會自動掃描常見的設(shè)置腳本并執(zhí)行,還能在運行時通過pip install等命令獲取依賴。在前端任務(wù)中,它可以啟動自己的瀏覽器,查看構(gòu)建結(jié)果,迭代改進(jìn),并把截圖附加到任務(wù)和GitHub PR中。
One More Thing
這次升級的時間節(jié)點也非常巧妙,正趕上Claude Code因模型質(zhì)量下降出現(xiàn)用戶退訂潮,本來就有很多用戶開始嘗試Codex。
OpenAI立馬趁火打劫,升級成GPT-5版本,真刀真槍來搶AI編程市場了。

另外能不能幫微軟把Copilot也升級一下,就在幾個月前負(fù)責(zé).NET Runtime項目的微軟老哥還在受弱智AI的折磨。
































