今天,OpenAI徹底顛覆AI助手!ChatGPT智能體上線,融合三大AI 原創(chuàng)
具備自主決策能力的ChatGPT智能體正式發(fā)布!無縫融合思考、操作、進(jìn)化三大AI引擎。
?
今天凌晨,OpenAI 臨時(shí)直播,奧特曼與四位研究員正式宣告 ChatGPT Agent 上線——一個(gè)能自主思考、規(guī)劃并執(zhí)行復(fù)雜任務(wù)的AI智能體。
?
?
奧特曼更是直言「這讓我真切感受到AGI的存在」。據(jù)介紹,ChatGPT Agent 融合了 Operator 智能體網(wǎng)頁交互能力、Deep Research 的互聯(lián)網(wǎng)信息搜集能力,以及 ChatGPT 的對話能力,成為了一個(gè)統(tǒng)一智能體。
?
?
它具備自主思考和行動(dòng)的能力,能夠主動(dòng)從 Operator、Deep Research 和 ChatGPT的技能庫中選擇合適的工具,來完成各種超復(fù)雜任務(wù)。這意味著 ChatGPT 不再只是那個(gè)大家熟悉的問答機(jī)器人,還能通過 “內(nèi)置計(jì)算機(jī)” 代表用戶完成復(fù)雜的多步驟任務(wù)。
?
OpenAI 介紹稱,ChatGPT 智能體能夠通過互聯(lián)網(wǎng)搜索或 API 獲取數(shù)據(jù),進(jìn)行深入的財(cái)務(wù)研究、制作精美的幻燈片,或者預(yù)定活動(dòng)、規(guī)劃行程。
?
在內(nèi)部基準(zhǔn)測試中,ChatGPT 智能體展現(xiàn)出能夠處理入門級投資銀行分析師(1 - 3 年工作經(jīng)驗(yàn))任務(wù)的能力,比如為財(cái)富 500 強(qiáng)公司構(gòu)建符合準(zhǔn)則的財(cái)務(wù)報(bào)表模型,或?yàn)樗接谢灰讟?gòu)建杠桿收購模型。
?
?
在演示中,OpenAI 給出了有趣的案例。根據(jù)結(jié)婚請柬上的日期、地點(diǎn)和著裝要求,ChatGPT 智能體根據(jù)提示詞,通過自主瀏覽、顯示思維鏈并執(zhí)行任務(wù),圓滿地完成了工作,列出了所有推薦的男裝、鞋子商品,并附上推薦理由和鏈接。
?
?
在另一個(gè)案例中,它被要求根據(jù)美國職業(yè)棒球大聯(lián)盟賽程,規(guī)劃一條在 2025 賽季常規(guī)賽期間,走遍全美 30 座大聯(lián)盟棒球隊(duì)的觀賽路線,推薦酒店住宿,最后以電子表格的形式呈現(xiàn)并生成一張可視化路線圖,它也出色地完成了任務(wù)。
?
用戶甚至可以要求它分析三個(gè)競爭對手并制作幻燈片演示文稿,只需要一個(gè)提示,ChatGPT 智能體就會(huì)幫你完成所有工作,你只需等待結(jié)果就好。
?
技術(shù)實(shí)現(xiàn)層面,OpenAI 采用了創(chuàng)新的"鏈?zhǔn)酵评砑軜?gòu)"。不同于常規(guī)模型的單次響應(yīng),智能體在接收指令后會(huì)啟動(dòng)多輪內(nèi)部思考:首先解析任務(wù)目標(biāo),然后規(guī)劃執(zhí)行路徑,接著調(diào)用瀏覽器、代碼編輯器等外部工具,最后驗(yàn)證結(jié)果并調(diào)整策略。
?
此外,還配備了多種網(wǎng)絡(luò)工具,包括可視化瀏覽器、文本瀏覽器和直接 API 訪問權(quán)限。
?
對于大家關(guān)心的數(shù)據(jù)安全問題,OpenAI 表示,ChatGPT 智能體在執(zhí)行敏感或重要操作(例如發(fā)送郵件、購買商品、提交個(gè)人數(shù)據(jù))時(shí),會(huì)明確征求用戶授權(quán)。
?
當(dāng)用戶在使用 ChatGPT 智能體訪問金融網(wǎng)站時(shí),將不能離開當(dāng)前標(biāo)簽頁,否則工具會(huì)停止運(yùn)作。而對于讓 ChatGPT 智能體炒股這類操作暫時(shí)受到限制,主要考量是避免 AI 出錯(cuò)導(dǎo)致高額損失。
?
在安全性方面,它具備主動(dòng)監(jiān)督和風(fēng)險(xiǎn)緩解功能,能夠主動(dòng)拒絕高風(fēng)險(xiǎn)任務(wù),例如金融交易或敏感法律互動(dòng)。
?
根據(jù) OpenAI 公布的測試數(shù)據(jù),ChatGPT 智能體在 “人類最后的考試” 中,單次嘗試通過率達(dá) 41.6%,遠(yuǎn)超此前 OpenAI o3 模型的 20.3% 和 Deep Research 的 26.6%。
?
?
在 BrowseComp 基準(zhǔn)中,它以 68.9% 的成績創(chuàng) SOTA,比 Deep Research 高 17.4%。
?
?
同時(shí),在 WebArena? 基準(zhǔn)測試中,相較于由 o3 驅(qū)動(dòng)的 CUA,ChatGPT 智能體表現(xiàn)更佳。
?
?
目前該功能已向 Pro、Plus 和 Team 用戶開放,OpenAI 表示將在未來幾周內(nèi)向更多用戶開放,并整合更多功能。據(jù)內(nèi)部路線圖,未來智能體將支持自定義工作流,允許企業(yè)接入內(nèi)部系統(tǒng)。
?
想象一下,當(dāng)AI能直接操作公司的 ERP、CRM 系統(tǒng),自動(dòng)處理財(cái)務(wù)報(bào)銷、客戶跟進(jìn)等事務(wù),或許整個(gè)辦公生態(tài)都將被重新定義。
