剛剛,奧特曼官宣ChatGPT「終極OS入口」!8分鐘速搭智能體,8億人狂歡
OpenAI 2025開發(fā)者日,奧特曼的精彩演講引爆全場(chǎng)!

現(xiàn)場(chǎng),50分鐘發(fā)布會(huì),奧特曼重磅官宣了四項(xiàng)重大更新:
- Apps SDK:與外部應(yīng)用無(wú)縫集成,OpenAI最大野心——把ChatGPT打造成未來(lái)的操作系統(tǒng);
 - AgentKit:無(wú)需編碼,拖放搭建智能體。人人都可快速開發(fā)智能體,還能評(píng)估智能體能力;
 - Codex全面可用:不寫一行代碼,打造爆款A(yù)PP;
 - API更新:三大API更新,Sora 2 API同步上線。
 

最最重磅的,還是Apps SDK,所有人皆可在ChatGPT中構(gòu)建原生應(yīng)用,其意義堪比2023年首發(fā)的GPTs。
這預(yù)示著,ChatGPT又將成為一個(gè)新時(shí)代的「APP Store」!

正如爆料所言,AgentBuilder讓智能體構(gòu)建變得像搭積木一樣簡(jiǎn)單直觀?,F(xiàn)場(chǎng),僅用8分鐘拖拽,便一鍵完成了完整Agent的搭建。

自從2023年11月首屆開發(fā)日以來(lái),短短兩年,OpenAI開發(fā)者規(guī)模已經(jīng)從200萬(wàn)增長(zhǎng)到400萬(wàn),翻了1倍!
ChatGPT周活也從1億暴增超8億,翻了8倍!
現(xiàn)在,OpenAI API每分鐘都有近60億token產(chǎn)生,相比此前的3億token,翻了20倍!
這些里程碑的數(shù)字不僅代表增長(zhǎng),更意味著AI正在成為新的技術(shù)基礎(chǔ)設(shè)施。


OpenAI未來(lái)的野心,全部藏在了這場(chǎng)發(fā)布會(huì)的四大核心發(fā)布中。
ChatGPT,下一代「操作系統(tǒng)」
首先,奧特曼帶來(lái)首個(gè)重磅發(fā)布叫做——Apps SDK。
意味著你可以在ChatGPT直接調(diào)用其他APP。借助Apps SDK,ChatGPT可以集成各種應(yīng)用。

這個(gè)功能完全反映了OpenAI的野心!
奧特曼想把ChatGPT打造成未來(lái)的操作系統(tǒng)。

現(xiàn)在我們的應(yīng)用都是運(yùn)行在MacOS、Windows、Linux等操作系統(tǒng)上。
未來(lái),ChatGPT將成為更上級(jí)的「操作系統(tǒng)」,即使是專業(yè)APP,都可以直接「運(yùn)行」在ChatGPT里。
ChatGPT的目標(biāo)是成為「操作系統(tǒng)級(jí)」的入口,而不僅僅是一個(gè)「應(yīng)用」!
OpenAI的應(yīng)用CEO Fidji Simo盛贊這個(gè)功能將「無(wú)法想象」,非常期待開發(fā)者打造的應(yīng)用。

奧特曼想把ChatGPT變成每個(gè)人的「默認(rèn)界面」,就像曾經(jīng)Windows桌面是每個(gè)人的「默認(rèn)界面」一樣。

目前公布支持的APP包括:Booking.com、Canva、coursera、Expedia、Figma、Spotify和Zillow。

OpenAI的軟件工程師Alexi現(xiàn)場(chǎng)展示了如何在ChatGPT直接調(diào)用這些外部應(yīng)用。
比如只需要輸入「Coursera」,ChatGPT就能自動(dòng)識(shí)別并調(diào)用Coursera的功能。

可以直接在ChatGPT中要求「Canva」制作海報(bào),而不需要額外跳轉(zhuǎn)。

類似的,可以直接在ChatGPT中使用Zillow查詢周邊房?jī)r(jià),并使用Zillow的UI來(lái)直接呈現(xiàn)。

奧特曼承諾,更多應(yīng)用即將上線。

一鍵拖拽,8分鐘搭一個(gè)Agent
第二個(gè)全新的功能就是此前劇透的可視化智能體構(gòu)建平臺(tái)。

新功能名為AgentKit,是面向開發(fā)者和企業(yè)的一整套構(gòu)建、部署和優(yōu)化智能體的工具。
AgentKit包含三個(gè)工具:
- Agent Builder:可視化畫布
 - Connector Registry:管理數(shù)據(jù)和工具如何連接
 - ChatKit: 嵌入定制聊天界面的工具包
 

Agent Builder是一個(gè)全新的可視化拖拽平臺(tái),AI智能體的構(gòu)建流程就像搭積木一樣簡(jiǎn)單!

ChatKit可以生成各種各樣的聊天工具,提供獨(dú)一無(wú)二的Chat體驗(yàn)。

此外,OpenAI這次還提供了評(píng)估智能體能力的Eval指標(biāo)。

通過(guò)四個(gè)方面,數(shù)據(jù)集、跟蹤評(píng)分、自動(dòng)化提示和第三方模型支持,來(lái)評(píng)估新建智能體的能力。

關(guān)于如何定義Agents,什么是智能體的定義,奧特曼在這次大會(huì)也給出了一個(gè)答案:
「能夠?yàn)槟愎ぷ鞯南到y(tǒng)」都可以稱為智能體,Agents!

奧特曼現(xiàn)場(chǎng)展示了Albertsons如何構(gòu)建智能體來(lái)分析銷量。

比如,可以直接讓ChatGPT出一個(gè)提高冰激淋銷量的方案。

OpenAI平臺(tái)體驗(yàn)部門的Christina Huang現(xiàn)場(chǎng)直播展示了,如何只用8分鐘就構(gòu)建一個(gè)完整的智能體!

使用Agent Builder無(wú)需寫任何一行代碼,全程只需要拖拽和參數(shù)配置。

現(xiàn)在Agent Builder功能已經(jīng)在OpenAI Platform網(wǎng)站上線。

簡(jiǎn)單體驗(yàn)了下,構(gòu)建過(guò)程非常的絲滑。

進(jìn)入開發(fā)者平臺(tái),點(diǎn)擊左側(cè)的「Agent Builder」即可使用。

構(gòu)建后,點(diǎn)擊右上角Evaluate即可開始對(duì)新建智能體的評(píng)估。

不寫一行代碼,打造爆款A(yù)PP
除了ChatGPT原生應(yīng)用和智能體,AI在軟件開發(fā)上,已帶來(lái)顛覆性的變革。
誰(shuí)曾想,如今,OpenAI內(nèi)部每周70%的PR都由Codex完成。

就比如,在Codex加持下,拖放搭建智能體工具從0開發(fā)僅用6周完成。

奧特曼稱,我們正進(jìn)入一個(gè)全新時(shí)代,任何有想法的人,都能為自己、家人、社區(qū)構(gòu)建一款應(yīng)用。
在此,他舉了幾個(gè)鮮活的、發(fā)生在每個(gè)人身邊的案例——

一位89歲退休日本老人,用ChatGPT自學(xué)編程為老年用戶開發(fā)了11款iPhone應(yīng)用;西班牙的一位老人和流媒體成員,借助ChatGPT、Sora等,幫人們重拾記憶;
在ASU醫(yī)學(xué)院,基于ChatGPT搭建的虛擬患者應(yīng)用,幫助學(xué)習(xí)模擬練習(xí)如何和患者溝通;還有在法國(guó)凡爾賽宮,官方基于Realtime API打造的一款A(yù)PP,讓游客與藝術(shù)品和雕塑進(jìn)行實(shí)時(shí)對(duì)話。

重點(diǎn)來(lái)了,今天起OpenAI Codex結(jié)束預(yù)覽,正式進(jìn)入通用可用階段。
自今年初首次發(fā)布,到GPT-5 Codex的迭代后,Codex的每日消息量增長(zhǎng)10倍,自發(fā)布處理了超40萬(wàn)億token。

這一次,新增功能包括:Slack集成、Codex SDK、企業(yè)控制。
目前,思科在內(nèi)部部署Codex后,代碼審查速度提升50%,項(xiàng)目平均周期從數(shù)周縮短至數(shù)天。

現(xiàn)場(chǎng),OpenAI開發(fā)者負(fù)責(zé)人Romain Huet帶來(lái)了「舞臺(tái)燈光控制器」的實(shí)時(shí)互動(dòng)演示。
設(shè)計(jì)原型非常簡(jiǎn)單,一個(gè)控制面板——左側(cè)是攝像頭畫面,右側(cè)排列操作按鈕。

全程無(wú)需手寫一行代碼,Codex快速生成一個(gè)功能齊全的界面。
「如何在Node.js中控制索尼FR7相機(jī)?」
面對(duì)C++ SDK的復(fù)雜性,Codex提出了更加優(yōu)雅的解決方案——基于VISC協(xié)議集成控制功能。

幾分鐘內(nèi),Codex不僅生成了Node服務(wù)器代碼,還解析了相機(jī)所需的UDP數(shù)據(jù)包,甚至發(fā)現(xiàn)了特定型號(hào)相機(jī)所需的特殊頭部信息。

僅僅用按鈕控制相機(jī)還不夠,下一步,讓Xbox無(wú)線手柄實(shí)現(xiàn)相機(jī)控制。
通過(guò)Codex IDE擴(kuò)展發(fā)送指令,Codex便會(huì)迅速制定計(jì)劃、分析文件,自動(dòng)識(shí)別Xbox的輸入邏輯,并將搖桿映射為控制的最佳方式。

運(yùn)行服務(wù)器,現(xiàn)場(chǎng)攝像頭畫面屏幕閃現(xiàn),臺(tái)下所有人揮手打招呼。


更令人興奮的是,它還集成了語(yǔ)音交互功能。
通過(guò)Codex的Realtime API和智能體語(yǔ)音,可以將自然語(yǔ)言引入這款應(yīng)用。
只需說(shuō)一句,「將燈光聚焦到觀眾席」,Codex便通過(guò)MCP服務(wù)器控制會(huì)場(chǎng)燈光系統(tǒng),瞬間點(diǎn)亮觀眾席。

最后,Romain還用Codex SDK拍了一張全體照片,實(shí)現(xiàn)了一個(gè)「電影式結(jié)尾」——演職員表,將現(xiàn)場(chǎng)所有參會(huì)者的名字動(dòng)態(tài)呈現(xiàn)。
這一切,全部通過(guò)語(yǔ)音指令完成。

Codex GA(General Availability)開放,標(biāo)志著軟件工程未來(lái)全新可能。
奧特曼現(xiàn)場(chǎng)表示,「它將最復(fù)雜的編碼難題簡(jiǎn)化為自然語(yǔ)言指令,唯一的限制就是你的想象力」。
三大API,Sora 2也上線了
最后,奧特曼帶來(lái)了三大API——GPT-5 Pro、gpt-realtime-mini、Sora 2。
開發(fā)者們可以搶先一步,享用最強(qiáng)GPT-5 Pro智能,其在指令遵循方面能力大幅提升,體驗(yàn)更優(yōu)。


在處理那些高精度、深度推理復(fù)雜任務(wù),GPT-5 Pro更拿手,尤其是在金融、法律、醫(yī)療保健等眾多行業(yè)。
如今,OpenAI API即可支持GPT-5 Pro的調(diào)用。
它的訓(xùn)練截止時(shí)間是2024年9月30日,400k上下文窗口,最大支持272k token輸出。
輸入價(jià)格:15美元/百萬(wàn)token,輸出價(jià)格:120美元/百萬(wàn)token。目前支持文本、圖像輸入,僅文本輸出。

最新的API定價(jià),再次刷新了價(jià)格天花板。
GPT-5 Pro輸入價(jià)格是GPT-5 15倍,輸出價(jià)格是GPT-5 12倍。


同時(shí),OpenAI還在API中發(fā)布了一款語(yǔ)音模型——gpt-realtime-mini。
這是兩個(gè)月前高級(jí)語(yǔ)音模型的縮小版,成本降低了70%,但語(yǔ)音質(zhì)量和性能保持不變。

奧特曼稱,「就我個(gè)人而言,我認(rèn)為語(yǔ)音將成為人們與 AI 交互的主要方式之一。而這次發(fā)布正是邁向這一現(xiàn)實(shí)的一大步」。
值得一提的是,幾天前剛剛上線的Sora 2,預(yù)覽版的API也正式上線。
視頻長(zhǎng)度、寬高比、分辨率,全程可控。

這意味著,任何一款A(yù)PP直接可以用Sora API,生成出令人驚嘆的視頻。
可控性,是Sora 2最大的優(yōu)勢(shì)。比如,拍攝iPhone視圖,Sora即可擴(kuò)展成一個(gè)全景電影寬鏡頭。
首次實(shí)現(xiàn)音畫同步,Sora 2直出背景、環(huán)境音效。
甚至,人們還可以將現(xiàn)實(shí)世界的片段融入Sora。比如,將自家狗照片上傳,就可以瞬間為它造出「賽博狗友」。

在電商廣告中,Sora 2還可以做概念開發(fā)。

一個(gè)用戶案例是,OpenAI聯(lián)手MATTEL,將創(chuàng)意師的產(chǎn)品創(chuàng)意瞬間變?yōu)楝F(xiàn)實(shí)。

演講的最后,奧特曼激動(dòng)表示,「我們正見證一個(gè)前所未有的時(shí)代」。
曾幾何時(shí),開發(fā)一款軟件需要數(shù)月,甚至數(shù)年的周期。
而今天,有了AI,一個(gè)想法可以在幾分鐘內(nèi)落地成型。
開發(fā)者不再需要一個(gè)龐大的團(tuán)隊(duì),只需一個(gè)好的創(chuàng)意,就能超越以往的速度,將靈感變?yōu)楝F(xiàn)實(shí)。
我們的愿景,是讓AI真正為每一個(gè)人所用。
而這個(gè)愿景,離不開你們每一個(gè)人的參與。
















 
 
 














 
 
 
 