AI大神Andrej Karpathy:OpenAI Operator預(yù)示著AI智能體的未來,但仍需突破!
各位小伙伴,最近 OpenAI 發(fā)布了 Operator 的研究預(yù)覽版,這是一個可以使用自己的瀏覽器為你執(zhí)行任務(wù)的 AI 代理,引起了廣泛關(guān)注。今天,我們來聽聽 AI 大神 Andrej Karpathy 對此的看法。他不僅深度參與了 OpenAI 的早期項目,還對 AI 的發(fā)展有著深刻的見解。
文章要點總結(jié):
- ?Operator 的類比:Karpathy 將 OpenAI 的 Operator 比作數(shù)字世界的人形機(jī)器人,兩者都是通用的系統(tǒng),能夠通過接口(鍵盤鼠標(biāo)或人體)執(zhí)行各種任務(wù)。
 - ?混合自主的未來:這類 AI 的出現(xiàn)將導(dǎo)致一個混合自主的世界,人類將扮演高級監(jiān)督者的角色,而 AI 則負(fù)責(zé)低級自動化。
 - ?數(shù)字世界的優(yōu)勢:由于數(shù)字世界的操作成本遠(yuǎn)低于物理世界,這種變革在數(shù)字世界發(fā)生的速度會更快。
 - ?技術(shù)挑戰(zhàn):雖然前景廣闊,但目前技術(shù)仍存在挑戰(zhàn),特別是多模態(tài)信息處理和長期任務(wù)規(guī)劃。
 - ?長期愿景:Karpathy 認(rèn)為未來是智能體的時代,我們可以通過智能體完成各種復(fù)雜的任務(wù),甚至運營整個公司。
 - ?長期發(fā)展:他預(yù)測 2025-2035 年將是智能體的十年,雖然目前仍有許多工作要做,但未來可期。
 
以下為 Karpathy 評論的中文翻譯:
像 OpenAI 的 Operator 這樣的項目之于數(shù)字世界,正如人形機(jī)器人之于物理世界。一個通用的設(shè)置(監(jiān)控鍵盤和鼠標(biāo),或人體),原則上可以通過最初為人類設(shè)計的 I/O 接口,逐步執(zhí)行任意通用的任務(wù)。在這兩種情況下,都會導(dǎo)致一個逐漸混合的自主世界,人類成為低級自動化的更高級別監(jiān)督者。有點像司機(jī)監(jiān)控自動駕駛儀。這在數(shù)字世界中發(fā)生的速度會比物理世界快,因為翻轉(zhuǎn)比特的成本比移動原子的成本低大約 1000 倍。盡管物理世界的市場規(guī)模和機(jī)會感覺要大得多。
我們實際上在 OpenAI 的早期就研究過這個想法(參見 Universe 和 World of Bits 項目),但它的順序不正確 - LLM 必須先出現(xiàn)。即使現(xiàn)在我也不敢 100% 確定它是否準(zhǔn)備好了。多模態(tài)(圖像、視頻、音頻)在過去一兩年才剛剛與 LLM 集成,通常是作為適配器附加的。更糟糕的是,我們還沒有真正涉足非常非常長的任務(wù)周期。例如,視頻包含了大量信息,我不確定我們是否可以期望將所有信息都塞進(jìn)上下文窗口(目前的范式),然后期望它也能工作。我想象這里可能需要一兩個突破,舉個例子。
我時間線上的人們都在說 2025 年是智能體之年。我個人認(rèn)為 2025-2035 年是智能體的十年。我覺得要讓它真正發(fā)揮作用,還需要在各個方面做大量工作。但它應(yīng)該能行。今天,Operator 可以幫你從 DoorDash 上找午餐,或查看酒店等,有時可以,也許可以。明天,你將為自己選擇的長期任務(wù)啟動 Operators 組織(例如運營一家公司)。你可以像一位 CEO 一樣同時監(jiān)控 10 個 Operators,有時可能會深入到具體工作中來解決一些問題。事情將會變得非常有趣。
文章解讀:
Karpathy 的評論清晰地指出了 OpenAI Operator 的重要意義,以及它在未來可能扮演的角色。 他認(rèn)為 Operator 不僅僅是一個工具,而是一個變革的開端,標(biāo)志著 AI 從簡單的任務(wù)處理向更復(fù)雜的自主行動轉(zhuǎn)變。 這也是一種 AI 智能體的雛形。
然而,他也強(qiáng)調(diào)了目前存在的技術(shù)挑戰(zhàn),比如如何處理多模態(tài)信息,以及如何讓 AI 理解和執(zhí)行長期的復(fù)雜任務(wù)。 這些問題都需要進(jìn)一步的研究和突破。
總結(jié):
Karpathy 的觀點為我們理解 OpenAI Operator 提供了一個重要的視角。它不僅揭示了這項技術(shù)的前景,也指出了未來發(fā)展中需要克服的挑戰(zhàn)。 雖然我們目前仍處于 AI 智能體發(fā)展的早期階段,但它未來的潛力是巨大的,值得我們期待。
本文轉(zhuǎn)載自 ??草臺AI??,作者: RangerEx


















