編輯 | 云昭
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
國慶假期期間,OpenAI 可謂賺足了全球的注意力。
先是各種 Sora2 的生成視頻刷屏,然后是三天前掌舵者 Sam Altman 在 DevDay2025 主題演講中高密度發(fā)布了許多利好AI開發(fā)者的功能和工具,可以說熱鬧空前。
但這些都不足以用來形容此時此刻 OpenAI 的未來藍(lán)圖。
在 DevDay 期間,這位 OpenAI 的掌舵者接受邀請錄制了一期播客,主持人跟他進(jìn)行了一場非常全面的深度腦暴。
訪談中,Altman 分享了自己對于 ChatGPT、Sora 的核心優(yōu)勢和商業(yè)模式的考量。他坦承,其實自己一開始也不清楚 ChatGPT 的核心優(yōu)勢是什么,但如今沒想到“記憶功能”卻成了最大的競爭優(yōu)勢之一。
而談及Sora的商業(yè)模式,他指出現(xiàn)在還為時尚早。主要看Sora的使用場景,如果是信息流,那自然會考慮引入廣告,但如果只是分享聊天,群發(fā),那就是另一種商業(yè)模式。
而對于AI開發(fā)者最看好的 Agentbuilder 工具,Altman 坦言以后真的可以實現(xiàn) Agent 的無代碼革命。
而 Codex 這一類的AI編程智能體以后甚至可以連續(xù)運(yùn)行一周,期間都不需要人類監(jiān)督和反饋。
對于大洋彼岸很火的一個名詞:“workslop”(工作糊料,即看起來挺體面,但實際很糟糕的交付結(jié)果),Altman 認(rèn)為經(jīng)濟(jì)會自我糾偏,因為人類本身自己也會產(chǎn)出工作糊料。
OpenAI的版圖還有哪些?是要打造美國版微信嗎?Altman 一口否認(rèn)了,他認(rèn)為微信模式在美國走不通,但的確計劃會在 ChatGPT 整合一些新功能。
“如果我們突然把一個「社交型體驗」塞進(jìn)去,會讓人感覺很怪?!?/span>
“用戶對 ChatGPT 的心理預(yù)期和他們使用娛樂應(yīng)用時的狀態(tài)完全不同,這兩種體驗放在一起會產(chǎn)生不協(xié)調(diào)。”
OpenAI 籌劃之中的藏貨還有多少呢?
訪談中,至少可以探秘出以下幾種:
一、ChatGPT 接下來會整合許多有交互能力的功能;
二、Sora 之后會在半年內(nèi)探索商業(yè)付費(fèi)模式;
三、新的AI硬件方面,AI語音交互將會是一大值得期待的亮點;
四、Agent方面,OpenAI 已經(jīng)在籌劃在法律、金融領(lǐng)域版本的 Codex。
五、而接下來的 GPT-6 構(gòu)建的設(shè)想,他表示最近發(fā)布的新基準(zhǔn)“GDPval”會考慮在內(nèi),會在后訓(xùn)練中做出相應(yīng)調(diào)整,但大方向不變。
對于 AGI,Altman 認(rèn)為實現(xiàn)它的時刻,不在于某個分?jǐn)?shù),而是 AI 真正開始為人類創(chuàng)造新知識時。
臨近最后,Altman 還討論到了未來的工作情況。他指出,在不久的將來,當(dāng)今經(jīng)濟(jì)中發(fā)生的 40% 的任務(wù)將由人工智能完成。AI 會讓數(shù)十億人的工作變得不再是真實的工作。
料還很多,建議大家自行收藏細(xì)讀。
最看好ChatGPT內(nèi)置應(yīng)用
主持人:Sam,非常感謝你來到這里。現(xiàn)在是 2025 年的 DevDay,你能先給我們介紹一下這次發(fā)布的內(nèi)容,以及你個人最期待的部分嗎?
Sam:其實我對所有內(nèi)容都很興奮。不過要我挑一個,我想說——ChatGPT 內(nèi)置應(yīng)用(Apps in ChatGPT)。這其實是我很早就想做的事。剛才我和幾位開發(fā)者聊了聊他們用 Agent Builder(或 Agent Kit)做的項目,真的有不少我自己都想立刻用的。如果只能選一個,那就是 Apps in ChatGPT。
主持人:我也喜歡 Agent Builder,不過 Apps in ChatGPT 的確很酷。我們可以從這里聊起。順便說一句,恭喜你們現(xiàn)在 ChatGPT 已經(jīng)有 8 億周活用戶了。
Sam:謝謝,這數(shù)字確實令人震驚。ChatGPT 正在成為一個新的“分發(fā)平臺”。
主持人:那開發(fā)者或創(chuàng)業(yè)者要如何利用這次發(fā)布的 App SDK,在 ChatGPT 之上構(gòu)建產(chǎn)品?
Sam:我認(rèn)為這還需要一段探索期,去觀察大家最終會怎么用這些 App。比如,人們會直接叫出 App 的名字嗎?還是希望 ChatGPT 能自動記住他們常用的 App 并主動推薦?這些新的分發(fā)機(jī)制需要開發(fā)者自己去摸索。但每次我們把東西交給世界時,總會被實際使用方式所驚喜到。
主持人:我聽說你們今天也會發(fā)布文檔,幫助開發(fā)者提高被推薦的幾率?
Sam:是的,不過要說明的是,這些都是全新的產(chǎn)品,變化會很快,我們也會邊學(xué)邊改。但沒錯,文檔今天就會放出。
Agent Builder 與 GPT Builder 的演進(jìn)
主持人:回到第一次 DevDay,兩年前你們發(fā)布了 GPT Builder,當(dāng)時引起了不小的轟動。我記得自己是最早做出公開 GPT 的開發(fā)者之一。這次的 Agent Builder,相比當(dāng)年,有哪些突破?
Sam:最大的不同是模型能力的躍升。這 22、23 個月的進(jìn)步實在太驚人了。除此之外,我們也學(xué)到了很多關(guān)于人們?nèi)绾蜗胍獦?gòu)建 agent 的經(jīng)驗,包括他們希望能在 ChatGPT 之外的服務(wù)上構(gòu)建。讓我印象最深的是,現(xiàn)在你能用一個可視化界面,上傳幾個文件、連接數(shù)據(jù)源、定義目標(biāo),幾分鐘內(nèi)就能部署出一個能做復(fù)雜任務(wù)的 agent。
昨天彩排時我看完整個流程,真有點震撼——像 Codex、Agent Kit 這樣的工具,讓“構(gòu)建軟件”的速度發(fā)生了地殼級的變化。我現(xiàn)在還沒完全理解這會帶來多大的影響。
AI Agent 的低代碼革命
主持人:如果我理解沒錯,現(xiàn)在通過 Agent Builder 已經(jīng)可以實現(xiàn)零代碼構(gòu)建 agent?
Sam:完全可以。當(dāng)然,如果你懂一點編程,會做得更細(xì)致更好;但一般的知識型工作者,現(xiàn)在也能自己做 agent。
主持人:那這基本就是“AI Agent 的無代碼革命”了。
Sam:沒錯。你會寫一點代碼能做更多,但入門門檻已經(jīng)非常低。我在想這會對下一波創(chuàng)業(yè)者、企業(yè)會有什么影響。昨天我看了 Romain 的現(xiàn)場演示,真是震撼——這些東西在一年前可能要花很久才能做出來,現(xiàn)在幾乎能“現(xiàn)場生成”。感覺創(chuàng)意的產(chǎn)生速度都跟不上實現(xiàn)的速度了。我還不能完全判斷這意味著什么,但顯然,軟件的生產(chǎn)速度將大幅提升,而從實驗到改進(jìn)的周期會越來越短。我們能更快驗證想法、篩選出好點子——只是我還不知道這會改變哪些更大的東西。
“零人公司”的賭局
主持人:我聽說你和朋友之間有個賭局,賭什么時候會出現(xiàn)第一個由 agent 運(yùn)營的十億美元公司?Agent Builder 能把我們帶到那個階段嗎?
Sam Altman:還沒那么快。我們以前的賭是“第一個一人公司”何時出現(xiàn);現(xiàn)在大家開始猜“零人公司”要多久。我們還沒正式開盤,但確實很多人在討論。我覺得至少要幾年時間。不過,僅僅是能認(rèn)真地討論“零人公司”這個概念,就已經(jīng)很不可思議了。
讓 Agent 一周不出錯地工作,需要什么
主持人:很多人都說這是“Agent 元年”,但目前的 agent 還需要大量人工監(jiān)督。你覺得什么時候才能出現(xiàn)能連續(xù)工作一周都不需要反饋的 agent?
Sam:我覺得 Codex 離那不遠(yuǎn)了——這話聽起來都像科幻?;蛟S 2025 年內(nèi)還達(dá)不到,但我們今天已經(jīng)看到它能完成“一天級任務(wù)”。進(jìn)步速度快得驚人。我很少會覺得“AI 進(jìn)步太快”,但在觀察 Codex 任務(wù)持續(xù)時長的提升時,確實有這種感覺。我猜,能持續(xù)工作一周的 agent,不會太遠(yuǎn)。
主持人:要實現(xiàn)那一步,還缺什么技術(shù)?
Sam:更聰明的模型、更長的上下文、更好的記憶系統(tǒng)。
世界變了,但核心優(yōu)勢的類型沒變
主持人:現(xiàn)在有了這一切工具,如果讓 20 歲、剛從斯坦福輟學(xué)的你穿越到今天,你會選擇做什么?又會避免做什么?
Sam:我前幾天其實剛想過這個問題。我真有點羨慕現(xiàn)在的年輕一代。他們面前的機(jī)會空間巨大到難以想象。我已經(jīng)很多年沒能空出一大段時間去思考“我想做什么項目”,但我知道,如果我現(xiàn)在 20 歲,我一定會有一堆想做的酷東西。今天跟這么多開發(fā)者聊天,看到他們在構(gòu)建的那些新東西——真的很讓人振奮。
主持人:有沒有什么建議,能幫助開發(fā)者在構(gòu)建這些產(chǎn)品時,找到屬于自己的“獨(dú)特優(yōu)勢”?比如分發(fā)渠道、數(shù)據(jù)壁壘,或者某種特定工作流?
Sam:這是個很難抽象回答的問題。我認(rèn)為最好的獨(dú)特優(yōu)勢,往往是獨(dú)屬于你自己、你必須親自摸索出來的東西。我們在 OpenAI 身上也花了極大的努力去找出那種差異化優(yōu)勢。但總體來說,這不是一個“通用解”。真正重要的優(yōu)勢,往往只在你所在的時機(jī)、市場定位、技術(shù)方向下才成立。而這種探索,本身就構(gòu)成了創(chuàng)業(yè)帶來的獨(dú)特價值。
如果要說一條普遍適用的經(jīng)驗,我會說——邊做邊找,策略是從戰(zhàn)術(shù)中長出來的。我很喜歡一句商業(yè)名言:“讓戰(zhàn)術(shù)演變成戰(zhàn)略?!蹦憧梢詮囊恍把巯掠行У男∈隆遍_始做,而在不斷嘗試的過程中,往往會自然衍生出一個更長遠(yuǎn)的戰(zhàn)略方向。
舉個例子,如果你在 ChatGPT 推出時問我:“你們未來的核心優(yōu)勢會是什么?”我可能會回答:“不知道?!蔽铱梢圆乱欢?,但不會有信心。結(jié)果現(xiàn)在看來,“記憶功能”成了我們最大的競爭優(yōu)勢之一——它讓用戶愿意長期留在 ChatGPT。而當(dāng)初我們完全沒想到這一點。所以很多時候,你只是不斷構(gòu)建功能,然后在某個瞬間突然意識到:“哦,這東西居然能成為我們的長期壁壘。”
主持人:那有沒有一些線索,提示我們現(xiàn)在該往哪些“優(yōu)勢方向”去構(gòu)建,比如為 GPT-6 時代提前布局?
Sam:那就得你自己去摸索了(笑)。我很樂意哪天和你一起頭腦風(fēng)暴一下,因為那會挺有趣的。但老實說,OpenAI 已經(jīng)占據(jù)了我全部的腦容量,我都沒法再認(rèn)真去想怎么做新創(chuàng)業(yè)項目了——這點有點遺憾。雖然世界變了,但企業(yè)的核心優(yōu)勢類型其實沒怎么變:網(wǎng)絡(luò)效應(yīng)、品牌與營銷、用戶數(shù)據(jù)、市場網(wǎng)絡(luò)效應(yīng)……這些仍然是競爭力的基礎(chǔ)。不過,建立這些優(yōu)勢的新“戰(zhàn)術(shù)”,會隨著時代變化而更新。
GPT-5 vs Claude:GDPval 測試結(jié)果
主持人:OpenAI 最近發(fā)布了一個名為 GDPval 的新基準(zhǔn),用來衡量模型在各種知識型工作中執(zhí)行“經(jīng)濟(jì)上有價值任務(wù)”的能力。讓我驚訝的是,GPT-5 的表現(xiàn)排在 Claude Opus 之后,而你們依然選擇公開這個結(jié)果。你本人對此意外嗎?
Sam:首先,如果我們因為排名第二就不發(fā)布,那才真糟糕。我們會在某些領(lǐng)域最好,也會在別的地方被超越。要建立一個能持續(xù)進(jìn)步的文化,關(guān)鍵是坦然承認(rèn)別人暫時做得更好。我認(rèn)為 Anthropic 在理解企業(yè)級使用場景、以及讓模型輸出更優(yōu)雅的結(jié)構(gòu)化結(jié)果方面,做得非常出色。所以我并不驚訝,只是被激勵得想更快追上。
主持人:這次的評測結(jié)果,會改變你們構(gòu)建 GPT-6 的方式嗎?
Sam:可能會在后訓(xùn)練階段帶來一些調(diào)整,但總體戰(zhàn)略不會因此改變。
我們何時真正實現(xiàn) AGI?
主持人:你最近提過,你對 AGI 的定義是“在大多數(shù)經(jīng)濟(jì)上有價值的任務(wù)中超越人類”。那 GDPval 的哪個分?jǐn)?shù)會讓你說:“我們已經(jīng)實現(xiàn)了 AGI”?
Sam:我一直在思考這個問題。首先——就像很多人一樣,我對 AGI 有多個定義。離它越近,這個概念反而越模糊。不過,對我來說最重要的一點,也是最讓我意外的是——我們終于開始看到模型能進(jìn)行“原創(chuàng)發(fā)現(xiàn)”。比如,它能擴(kuò)展人類的知識邊界。
現(xiàn)在在 X(Twitter)上,你會看到越來越多科學(xué)家發(fā)帖說:模型提出了一個新的假設(shè)、發(fā)現(xiàn)了一個小規(guī)律、或者想出一種新的研究思路。這些都還非常微小,我不想夸大,但也不能忽視它的意義——我們正處在 AI 發(fā)現(xiàn)能力的起點。而我們有理由相信,在未來幾個月乃至幾年內(nèi),這方面會迎來加速。這,可能是我最在乎的“AGI 時刻”。它不是某個分?jǐn)?shù),而是當(dāng) AI 真正開始為人類創(chuàng)造新知識時。
AI 將要解決的科學(xué)突破
主持人:有沒有什么具體的科學(xué)突破,是你特別期待 AI 能去解決或推動的?
Sam:當(dāng)然,治愈疾病、發(fā)現(xiàn)新的物理定律——那種事情會非常令人振奮。但其實,眼下正在發(fā)生的一些“小事”,比如數(shù)學(xué)領(lǐng)域的進(jìn)展,也讓我感覺意義非凡。當(dāng) GPT-4 發(fā)布時,我記得很多人還在爭論“圖靈測試”的定義——但大眾心中的“圖靈測試”一直像是一個遙不可及的目標(biāo)。然而突然之間,它就被跨越了。而社會的反應(yīng)基本是——毫無波瀾。大家驚呼兩周,然后立刻抱怨:“這玩意怎么不夠快?”、“怎么不夠聰明?”、“能不能再好一點?” 這其實挺能說明人性的:那個長期以來代表 AI 極限的“考驗”被我們一瞬間甩在身后,而人類幾乎瞬間適應(yīng)了。我覺得接下來也會出現(xiàn)類似的情況——我們會非??斓亓?xí)慣 AI 進(jìn)行科學(xué)發(fā)現(xiàn)。這有點像 Waymo(無人駕駛):第一次上車確實怪異,但那種感覺只持續(xù)三分鐘,然后就變得理所當(dāng)然了。
從工作糊料到同意自己形象在Sora上對外公開
主持人:我想插一句。最近斯坦福有個研究,提出一個新詞——“工作糊料(workslop)”。簡單解釋一下,就是“看起來很體面、其實低質(zhì)量”的產(chǎn)出。他們調(diào)查了一千多位辦公室職員,41% 的人說最近一個月遇到過這種來自同事的“AI 糊料”。平均每次清理需要 1 小時 56 分鐘,每名員工每月因此損失約 186 美元。所以問題是:AI 能讓一部分人效率提升 10 倍,那我們在教育或新人培訓(xùn)中缺了什么?為什么很多人不知道什么時候該用 AI,什么時候不該用?
Sam:首先得說,很多人類自己也在制造“工作糊料”。這不是 AI 獨(dú)有的現(xiàn)象——比如那些只制造工作量的郵件,或者毫無意義的會議。其實從很久以前開始,就存在兩類人:一種人用工具提升效率;另一種人用工具給組織制造阻力。AI 也會一樣——不會例外。但經(jīng)濟(jì)會自我糾偏。那些能用工具提高產(chǎn)出的人和公司,會更有能力塑造未來;反之,那些拖慢效率的,會被邊緣化。當(dāng)然,每種新工具都有學(xué)習(xí)曲線,但這次我認(rèn)為會非??臁?/span>
主持人:那 OpenAI 是否在教育或培訓(xùn)上,做些什么來幫助人們更好地建立“AI 直覺”?
Sam:有的,我們確實在做。但人們總會以他們自己的方式使用工具。我學(xué)到的一點是——你可以做出極好的教育內(nèi)容、培訓(xùn)課程,但人們一旦發(fā)現(xiàn)他們能讓模型“用海盜口音說話”,他們就會去玩這個。不過我們確實在努力,制作大量幫助人們把 AI 整合進(jìn)日常工作流的內(nèi)容。在某些場景下,比如 Codex,企業(yè)的采用非常快——從試用到深度融合,只需要幾天或幾周。
主持人:說到“糊料”,你現(xiàn)在也是世界上第一個被 Sora 做成病毒級 meme 的 CEO。網(wǎng)上那些把你“換臉成 GPU 盜賊”的視頻,會讓你感到害怕嗎?
Sam:其實比我預(yù)想的沒那么怪異。很奇怪的是——看一個視頻會覺得不適,但連刷一百個反而沒那么怪。我記得那時我正在環(huán)球出差,有個團(tuán)隊成員發(fā)消息問我:“我們能不能把你的 cameo(出鏡形象)開放訪問?”我當(dāng)時八秒內(nèi)就回復(fù)“可以”,其實那應(yīng)該是個值得深思的問題。但我想,既然我們在做這項新技術(shù),我自己都不愿去嘗試,那就太說不過去了。結(jié)果我決定開放。之后在飛機(jī)上我想,這可能會挺奇怪的。但上線后我醒來一看,整個社交媒體都是 meme。我笑了。真的就是那種 Waymo 式的體驗——前 3 分鐘有點怪,然后就完全習(xí)慣了。唯一讓我擔(dān)心的,是今天早上有幾家公司發(fā)布了“去水印工具”。如果別人能把 Sora 的水印去掉,用我的形象發(fā)視頻,這可能會影響我的個人品牌。那我為什么還要開放自己的 cameo 呢?
主持人:所以你的意思是,提前發(fā)布帶有防護(hù)的版本,其實是為了幫助社會提前適應(yīng)?
Sam:沒錯。我們經(jīng)常會預(yù)見到某項技術(shù)遲早會被廣泛開放——幾個月或幾年后,任何人都能用開源模型生成視頻,甚至可以讓“你”做任何事。社會終會適應(yīng),但我們希望通過提前發(fā)布 + 加入防護(hù),讓社會和技術(shù)能夠共同進(jìn)化。文本時代我們已經(jīng)這么做過了。視頻更難,因為它帶來的情緒沖擊更強(qiáng)。但最終我們會學(xué)會適應(yīng)。未來網(wǎng)上會充斥著各種“假視頻”,很多都沒有水印、也無法追溯來源。這種情況一定會發(fā)生。讓社會對它提前“免疫”,是有價值的。
主持人:那最終目標(biāo)是做出“真假難辨”的 AI 視頻嗎?
Sam:最終目標(biāo)還是 AGI(通用人工智能)。高質(zhì)量視頻只是其中的重要一步。它能推動空間推理、世界模型學(xué)習(xí),甚至是機(jī)器人研究的進(jìn)展。我認(rèn)為“生成式視頻”是好事。我不希望未來人機(jī)交互只局限于文本。我很期待一個新形態(tài)的界面——你能在實時視頻流中與系統(tǒng)互動,它會動態(tài)生成屬于你的界面與體驗。所以,是的,高質(zhì)量視頻是通向真正 AGI 的寶貴一步。
考慮Sora視頻生成付費(fèi)
主持人:你們上周五發(fā)布了一篇博客,說正在考慮為允許自己肖像 cameo(客串)的視頻創(chuàng)作者推出分成機(jī)制。能透露下具體怎么運(yùn)作嗎?
Sam:就像很多新產(chǎn)品一樣——一旦上線,你總會發(fā)現(xiàn)用戶的使用方式和我們想象的不一樣。我們原本以為,Cameo 主要會由少數(shù)創(chuàng)作者制作一些很酷、精致、有創(chuàng)意的視頻內(nèi)容,然后被更大范圍的觀眾觀看和分享。確實有一些這樣的案例,但我們也看到大量用戶在為自己、或幾個朋友制作視頻,在群聊中互相分享。我還不確定這是不是一時的新鮮感,但如果這種使用方式真的能持續(xù)下去,那它將徹底改變我們對計算量與用戶參與度之間關(guān)系的模型。
未來,我們可能會允許用戶為視頻生成付費(fèi)。比如你想一天做 100 個表情包視頻發(fā)給朋友,那就可以直接付費(fèi)生成;如果視頻里出現(xiàn)某位名人,而那位名人也同意授權(quán),那他們也可以按生成次數(shù)獲得分成。當(dāng)然,現(xiàn)在這個產(chǎn)品才上線六天,所以我不敢太早下定論——也許這些用法只是階段性的熱度。但至少目前看,這確實是一個非常大的使用場景。
主持人:你們有沒有考慮過在 Sora 應(yīng)用里加入廣告?
Sam Altman:目前還沒有,但那確實是一個值得探索的方向——雖然也挺讓人害怕的(笑)。和 ChatGPT 不同,ChatGPT 的商業(yè)模式是訂閱制,但如果 Sora 未來的主要使用場景是用戶刷視頻流、看搞笑或美學(xué)內(nèi)容,那廣告模型會更自然。但如果用戶主要是在私信或群聊中分享視頻(DM 模式),那可能就該采用不同的商業(yè)邏輯。樂觀一點的話,我希望在今年年底前(或者保守點,明年一季度)我們能看清產(chǎn)品真正的使用形態(tài),到那時就能決定合適的商業(yè)模式。我個人認(rèn)為——按視頻生成次數(shù)收費(fèi)是合理的嘗試,其他想法還得看產(chǎn)品演化方向再定。
工作的未來:被 AI 改寫的十億個崗位
主持人:我常用“農(nóng)民的比喻”來形容現(xiàn)在的變革。如果你在 50 年前告訴一個農(nóng)民:未來會有個叫“互聯(lián)網(wǎng)”的東西,能創(chuàng)造十億個新崗位——比如程序員、營銷人員、內(nèi)容創(chuàng)作者——他一定不會相信?,F(xiàn)在我們進(jìn)入“智能時代”,很多人認(rèn)為也會有大量新崗位誕生。但不同的是:互聯(lián)網(wǎng)時代是從零創(chuàng)造新崗位,而智能時代則可能先影響現(xiàn)有的知識型崗位,然后才逐步催生新的機(jī)會。這點你會擔(dān)心嗎?
Sam:非常擔(dān)心。你提到了一個讓我又稍微放心、又更焦慮的問題。那位農(nóng)民,不僅不會相信未來的事情,他可能還會覺得我們今天的工作——比如你采訪我、我做科技公司——根本不算“真正的工作”。在他看來,“真正的工作”是種地、養(yǎng)娃、維持生命。我們這些現(xiàn)代人,只是在玩“虛擬的游戲”,讓自己感覺重要而已。也許再過幾十年,未來的人回頭看我們現(xiàn)在的工作,也會說:“那不算真正的工作,只是比游戲稍微認(rèn)真一點?!?/span>
所以我完全能想象——“工作”這個概念會發(fā)生深刻的變化。人們依然會找到意義,但“有意義的事情”未必還像現(xiàn)在這樣和“勞動”綁定。我認(rèn)為社會契約也會隨之重構(gòu),尤其是如果這場轉(zhuǎn)型來的很快的話。短期確實會有陣痛,但我依然相信——人類的創(chuàng)造欲和行動欲是不會消失的。我們總會找到值得去做的新事情。
AGI 之后:人類會去哪里?
主持人:那在 AGI 之后,你覺得人類會把注意力轉(zhuǎn)向什么?太空?腦機(jī)接口?
Sam:我希望是一切方向都能同時展開。太空探索當(dāng)然很酷,但也許你、我,或其他人會被別的事情吸引。我希望未來的世界是一塊廣闊無邊的可能性畫布,每個人都能在上面創(chuàng)造屬于自己的新事物。
全球 AI 安全框架
主持人:如果你明天可以制定一條全球政策,會是什么?
Sam:要把這個問題縮小到一個具體點其實挺難的。但我腦海里反復(fù)浮現(xiàn)的,是關(guān)于 AI 監(jiān)管的那場大辯論:到底這是好事還是壞事?會不會反而讓大公司獲益太多?我能理解各方的觀點。不過我確實認(rèn)為,當(dāng)我們進(jìn)入「超強(qiáng)模型」的階段時,應(yīng)該有一個全球性的框架來降低災(zāi)難性風(fēng)險——至少針對最前沿的那部分,要有一套機(jī)制去思考、評估最嚴(yán)重的安全問題。如果能有一個全球政策來處理這些問題,那會是一件好事。
主持人:你能大概描述一下這個框架的輪廓嗎?
Sam:我覺得可以先從一個完善的測試體系開始。
否認(rèn)打造美國版微信
主持人:還有一點我想談的是微信。在中國,它幾乎是一款「萬能應(yīng)用」——可以購物、刷社交媒體、聊天,幾乎所有功能都集中在里面。現(xiàn)在看起來,ChatGPT 也有購物、網(wǎng)頁搜索、Sora 等等新功能。你是不是在嘗試打造一個「美國版微信」?
Sam:不是。有很多原因讓我認(rèn)為那種模式在美國市場行不通。我們不是要做「萬能 App」,而是想打造一個真正出色的 AI 超級助手。
主持人:那為什么要把功能分開發(fā)布?比如 Sora 為什么是單獨(dú)的 App,而不是直接整合進(jìn) ChatGPT?
Sam:因為 ChatGPT 對很多人來說,已經(jīng)成了他們最個人化的賬戶。如果我們突然把一個「社交型體驗」塞進(jìn)去,會讓人感覺很怪。當(dāng)然,有一些功能比如消息協(xié)作是合理的,因為用戶確實會互相分享內(nèi)容、一起創(chuàng)作。但用戶對 ChatGPT 的心理預(yù)期和他們使用娛樂應(yīng)用時的狀態(tài)完全不同,這兩種體驗放在一起會產(chǎn)生不協(xié)調(diào)。不過我們確實會把很多功能整合進(jìn) ChatGPT,只是會分階段來做。
關(guān)于 Agent 構(gòu)建:看法法律、金融版本的Codex
主持人:你覺得有哪些特別重要或有潛力的智能體(Agent)是你最期待看到的?
Sam:我會參考 Codex 的影響力去思考其他行業(yè)。比如,能不能有一個「法律版 Codex」、一個「金融建模版 Codex」?現(xiàn)在已經(jīng)有很棒的創(chuàng)業(yè)公司在嘗試這些方向。但如果技術(shù)繼續(xù)成熟,能讓這些行業(yè)的 AI 體驗像 Codex 之于編程那樣強(qiáng)大,那將是我最興奮的事情。我甚至能想象未來,一個人就能通過與一組智能體的對話來創(chuàng)建一家公司。目前的 Agent Builder、Agent Kit 還沒到那個水平,但我能看到從現(xiàn)在到那一步的路徑。
我們低估了語音設(shè)備
主持人:你在主題演講里提到,語音可能是 AI 或 Agent 的「最終交互界面」,能展開講講嗎?
Sam:我不會說它是最終界面,因為在很多場景下語音并不合適。比如你在地鐵上,對著手機(jī)講話就挺尷尬的。但在很多時候,語音又是最自然的接口。廣義上說,「語言」才是核心交互方式,有時是語音,有時是打字。我們曾經(jīng)低估了語音設(shè)備。大家喜歡拿智能音箱開玩笑,但其實很多人真的在用,也很喜歡它們——只是它們的 AI 水平還不夠好,生態(tài)也不完善。如果未來你能直接「對設(shè)備說話,它就精準(zhǔn)執(zhí)行并不再打擾你」,那才是我真正想用的計算機(jī)。
新的 I/O 硬件設(shè)備:留足創(chuàng)造空間
主持人:那你們在做的 I/O 設(shè)備呢?是否也會以語音為主要交互?
Sam:那還需要一些時間。要在高質(zhì)量、高規(guī)模的前提下打造一種全新的計算機(jī)使用方式,我們需要留出足夠的創(chuàng)造空間。我們現(xiàn)在確實有一些很讓人興奮的想法,但還沒準(zhǔn)備好公開討論。短期內(nèi)也不會公布,但我們會努力讓它「值得等待」。
主持人:好的,這就是我所有的問題了。
Sam:謝謝,能聊得這么深入我也很高興。





























