整理 | 伊風
出品 | 51CTO技術棧(微信號:blog51cto)
剛剛,奧特曼又有了一個新采訪!干貨滿滿。
在這場訪談中,OpenAI CEO 奧特曼接受了印度博主兼開發(fā)者 Varun Mayya 的專訪,聊到了多個當前 AI 技術從業(yè)者最關心的話題:包括最近火爆出圈的 GPT-4o 圖像生成能力、Prompt Engineer 是否真的值得存在、Agent 的落地路徑等等,甚至還有他本人對 AI 帶來失業(yè)焦慮的思考。
畫個重點,本次采訪亮點有:
- GPT-4o爆火,“現(xiàn)在生成的圖像數(shù)量遠遠超過了我原本以為互聯(lián)網有的需求。我們很快就會突破十億張總圖像的里程碑?!?/span>
- 談到“一鍵生成吉卜力”、宮崎駿"反對AI”的爭議話題,奧特曼表示AI會帶來內容創(chuàng)作的民主化?!爱斎?,它也帶來一些負面影響,也確實改變了藝術形式本身。但從整體來看,這是進步。”
- “套殼”也會產生了不起的生意,OpenAI也是從這種貶低中成長起來的“他們說你們不過是個小研究實驗室,遲早會被 Google 碾壓。你們只是把點子包裝一下,真正的價值會被視頻平臺拿走、被大公司搶走。”
- 對于編程自動化問題,重要的是“提效”而非AI完全接管編程工作:“你說完全 100% 自動化,能構建一個復雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關注的是“程序員效率提升10倍”這種事情。我認為今年或明年就可能發(fā)生。”
- 不過,編程仍然是OpenAI的Agent瞄準的方向。奧特曼表示,“代碼領域將會成為一個重要突破口?!?/span>
以下是經過整理的播客訪談全文,為了方便閱讀,順序略微調整:
GPT-4o大爆:我們即將突破十億張總圖像生成里程碑
主持人:女士們先生們,我現(xiàn)在與 Sam Altman 在一起。Sam,最近我看到你發(fā)了不少推文。他們以前叫“posts”,現(xiàn)在又改叫“Xs”。我都不知道現(xiàn)在該叫什么了。
奧特曼:我也不知道他們現(xiàn)在叫啥。
主持人:反正你最近發(fā)了不少關于印度的內容,也發(fā)了很多關于新版圖像生成的內容。首先我得說,我有幸提前試用了那個圖像生成工具,真的非常棒。從情緒板制作、生成圖片、到UI設計,體驗都非常出色。而且這個工具還很智能。
我們做了個特別聰明的用例——我們讓它生成一個3D模型的正面圖,然后再讓它生成左側視角、右側視角和背面視角,再把這些圖像扔進另一個模型中生成網格,并把這些貼圖重新映射上去。我們甚至還能讓它生成高度圖。想想幾個月前這些還不存在,現(xiàn)在居然做到了,真的太震撼了?,F(xiàn)在的用戶反響如何?有沒有什么數(shù)據(jù)可以分享?
奧特曼:我不確定能不能分享具體數(shù)字,但我可以說,我們現(xiàn)在生成的圖像數(shù)量遠遠超過了我原本以為互聯(lián)網有的需求。我們很快就會突破十億張總圖像的里程碑。
主持人:哇哦,那可是個巨大的數(shù)字。你有沒有看到什么特別有創(chuàng)意的用法?除了把自己變成動漫風之外。
奧特曼:讓我覺得特別興奮的是各種各樣的創(chuàng)意用例。當然,最開始火起來的是把自己變成動漫角色,但后來我看到人們創(chuàng)造了很多我以前完全沒想過的新類型圖像,真的很驚喜。當然,也有很多很棒的商業(yè)用途,比如小企業(yè)用它來做新Logo、平面設計等等。但最打動我的是那種純粹的創(chuàng)造力——人們用它做出了前所未有的圖像,這真的讓我很激動。
GPT-4o會讓設計類工作走向消亡嗎?——還未可知,但會有新工作
主持人:太棒了。我還想聊聊另一個方面,就是UI和設計類工作。我們原本以為這些工具一發(fā)布,就能代替我們完成大部分工作。但實際上,在我們公司,我們還有很多視頻剪輯師和平面設計師。結果發(fā)現(xiàn)我們還是需要人來操作這些工具——因為人類仍然需要負責任,需要維持上下文,某種程度上相當于這些工具的“經理”。你覺得這就是工作的演變路徑嗎?你有沒有觀察到類似現(xiàn)象?或者說你對未來工作的變化有怎樣的看法?
奧特曼:我覺得這會因職業(yè)而異,有些工作可能會完全消失,由AI端到端完成。但大多數(shù)情況是,人們有了新工具后,工作效率更高、質量更好。比如,依然會有人負責讓網站看起來很棒,只不過大家對網站“好看”的期待會提升,結果是我們所有人都能看到更好的成果。也許內容產出還會變多,在這樣的世界中,對這類工作的需求可能會更高。然后還會出現(xiàn)一些全新的職業(yè),這是我們現(xiàn)在還沒見過的。
主持人:你現(xiàn)在有沒有一些例子?
奧特曼:比如一些客戶支持類的工作,我認為AI已經能端到端完成了,那屬于我剛才提到的第一類。至于第二類——我們剛剛在說的平面設計師的例子——審美仍然非常重要。
你知道的,平面設計師以前用紙筆做設計,后來有了電腦工具,他們能做得更多、更好。我們仍然需要優(yōu)秀的平面設計?,F(xiàn)在我們又有了新工具,它顯然會改變設計師的工作流程,一些原本有人付錢的任務,現(xiàn)在可能不會再有人付錢。
在我看來,未來依然會有“讓這個網站好看”的崗位,也許從業(yè)人數(shù)減少了,但他們收入更高;又或者從業(yè)人數(shù)變多了,因為我們突然能做出更多網站了。也許這個世界原本對平面設計的需求就遠比我們承受得起的高——這方面我們現(xiàn)在還不好說。
還有一種是全新的工作類型,第一個例子就是“Prompt Engineer(提示工程師)”。在AI出現(xiàn)之前,根本不存在這個職位。甚至很難想象有這么一種職業(yè)。現(xiàn)在有很多這樣的例子,但這個對我來說最親切。
主持人:確實很有意思,每當這些新職業(yè)出現(xiàn)時,總是先被人嘲笑。比如那些做“套殼”(rapper)的人,我們后面會聊到。就算是“提示工程師”,很多人現(xiàn)在也不當回事。大家覺得只是寫寫英文而已。你會為這個職業(yè)辯護嗎?有沒有什么方法能讓這些剛進入這個領域的人不覺得自己在“掉價”?
奧特曼:我小時候就知道我想學計算機編程,可是我身邊的大人都說,那就是個愛好,不是正經職業(yè)。那時候他們覺得電腦沒前途,非得去當醫(yī)生、律師這種“穩(wěn)定職業(yè)”才算正經。他們覺得學編程是條危險的路。但我當時覺得我理解了一些他們不懂的事。我真心鼓勵大家相信自己的判斷——就算某個工作在過去不是高地位、被認可的,也不代表它將來不會變得有價值。這就是科技進步的方式。
主持人:你以前寫過一篇博文,叫《被誤解的勇氣》(The Strength to Be Misunderstood),我超喜歡那篇。那篇文章真幫了我很多。你是很多年前寫的,我當時剛決定做內容創(chuàng)作者,那時候這個職業(yè)地位也不高。
奧特曼:說到你的工作,我記得大概十年前吧,我會去和年輕人聊創(chuàng)業(yè)。我喜歡問他們覺得哪些行業(yè)最有意思,因為年輕人的觀點往往不一樣,而且往往是對的。當時很多人說他們想做YouTuber。我當時一臉懵逼,心想:啥?但那一刻我意識到:我不能像別人以前否定程序員那樣,去否定他們。
正面回應宮崎駿反對AI創(chuàng)作事件:內容創(chuàng)作的門檻降低是好事
主持人:我還想提另一個最近在網上爭議比較大的話題:宮崎駿的那個視頻。那個視頻當然是被斷章取義了——他在看一個很早期的模型動畫,一個怪物在扭動,他說“我不喜歡這個”。作為一個從業(yè)幾十年的藝術家,我能理解他的感受。我們創(chuàng)作圖像或視頻的過程,曾經需要付出大量努力,現(xiàn)在卻變得簡單多了,有時反而有點失落。
作為藝術家,這種變化多少有點讓人沮喪。但作為一個創(chuàng)業(yè)者,要養(yǎng)團隊、發(fā)工資,我又覺得這項技術非常有價值,它幫我提升了效率,減輕了壓力。你怎么看藝術的變化?我們該如何看待它?
奧特曼:想象一下三十年前你想做你現(xiàn)在做的事情,那幾乎是不可能的。你需要一個攝像機、VHS錄像帶,還得想辦法剪輯,這些步驟都很復雜。就算完成了,還得自己去分發(fā)錄像帶,因為當時還沒有YouTube,網絡也很差。但現(xiàn)在,世界上任何人只要有一部智能手機,就能拍攝并上傳視頻。如果他說的內容有趣,全世界都能看到并受益。
我認為內容創(chuàng)作的民主化對社會是個巨大好處。當然,它也帶來一些負面影響,也確實改變了藝術形式本身。但從整體來看,這是進步。我非常相信科技的力量,它可以賦予所有人更多工具,降低門檻,讓更多人有能力為社會做貢獻,最終大家都能從中獲益。是的,它可能會導致一些工作消失,也讓原本憑技能吃飯的人面臨更多競爭。但總體來說,這是社會的福祉。
我自己的親身經歷是看到創(chuàng)業(yè)門檻的變化。以前創(chuàng)業(yè)需要很多資金和資源,但后來這些門檻都被削弱了,特別是像 AWS 的出現(xiàn),這是其中最重要的轉折點之一。
另一個大變化就是互聯(lián)網的普及。再加上 Y Combinator 從 2005 年起所推動的一種潮流——年輕、有技術背景的創(chuàng)始人突然可以更容易地創(chuàng)辦公司了。這帶來了大量的新產品和新技術,造福了整個世界。當然,被這些公司競爭掉的傳統(tǒng)企業(yè)可能不太高興。但從世界公民的角度來說,我們確實擁有了更多可能性。OpenAI 本身也是一個例子——我們這個小團隊能做出這樣的事,只是因為技術棧的準入門檻大大降低了。
我同意,特別是像 Stripe 出現(xiàn)之后,還有在印度,UPI 的普及,讓新的公司、新的產品激增。以前很多事因為繁瑣的流程根本做不起來。我猜設計領域現(xiàn)在也開始出現(xiàn)類似的變化。
套殼OpenAI也能獲得成功,重要的是走自己的創(chuàng)業(yè)路
主持人:說到 Y Combinator,我想請你戴上“20歲版本的你”的帽子——假設你回到當年,知道現(xiàn)在所有的一切,有人勸你別去做“GPT套殼”(rapper),因為 OpenAI 遲早會干掉你;也有人說基礎模型沒用,套殼才是能賺錢、能融資的東西。在這樣的辯論下,你會怎么做?
奧特曼:你只是在做套殼”這種說法,其實以前在別的領域也常見。有人也說過,“你只是建立在 AWS 上的一個套殼”,類似的評論也不少。
但現(xiàn)在,人們基于 AI 正在建立非常了不起的新公司。大多數(shù)公司會失敗,或者發(fā)展一般,但有些會找到持久的商業(yè)模式,創(chuàng)造巨大的價值。這一直都是世界的運行方式——大多數(shù)初創(chuàng)公司都會失敗,但少數(shù)成功的會極其成功。所以,把所有東西都簡單 dismiss 掉,說它們只是套殼,聽起來好像很聰明,但實際上完全錯了。我記得人們以前對 OpenAI 也有類似的說法。
主持人:他們當時都說了啥?
奧特曼:他們說你們不過是個小研究實驗室,遲早會被 Google 碾壓。你們只是把點子包裝一下,真正的價值會被視頻平臺拿走、被大公司搶走。這些話還是一兩年前說的。我覺得,有些話聽起來酷又老練,像是能看透一切。但要建立偉大的公司或投資它們,最關鍵的一課是:不要被這種“偽聰明”的觀點帶偏。所以如果我是現(xiàn)在在 YC 的 20 歲年輕人,有人說我做的是 GPT 套殼,我反而會覺得:嘿,我可能走在了正確的方向上。
主持人:那你有沒有具體的想法?如果你不是在 OpenAI,而是一個普通創(chuàng)業(yè)者,手上有 50 萬美元,你會做什么?
奧特曼:出于原則,我一般不回答這種問題。因為我最在意的是:大家不要去復制別人的創(chuàng)業(yè)點子。
我自己想出來的創(chuàng)業(yè)點子,說不定都挺“平庸”的。而某個現(xiàn)在正在寫代碼的 20 歲年輕人,提出一個聽起來荒謬又“爛透了”的想法,說不定那才是下一個 OpenAI。我不希望我拋出一個“中規(guī)中矩、與現(xiàn)實脫節(jié)”的想法,讓別人因此放棄自己瘋狂又獨特的創(chuàng)意。所以我的建議是:去做你那個瘋狂的點子。如果你覺得它對,那它就值得嘗試。
主持人:就像你必須做你真正熱愛的事情,否則你永遠也造不出 Snapchat。因為在第一天,所有人都會說這想法太爛了。太棒了 Sam。
AI讓程序員提效10倍,今年就能實現(xiàn)
主持人:我們前幾天剛和你們的 CPO Kevin 做了一期播客,他跟我說代碼自動化會在 2025 年實現(xiàn)。Anthropic 說是 2027 年,他說不,我們能更快,可能 2025 或 2026。那你怎么看?你覺得什么時候“寫代碼=寫英文”會變成現(xiàn)實?還是說根本不會?
奧特曼:我覺得更重要的問題是“自動化的程度”。如果你說完全 100% 自動化,能構建一個復雜系統(tǒng)而完全不碰代碼——這是一種情況。但我更關注的是“程序員效率提升10倍”這種事情。我認為今年或明年就可能發(fā)生。
主持人:就是說程序員效率提升10倍。其實現(xiàn)在已經提升了好幾倍了吧?我身邊用上 AI 的人,效率已經提升得很明顯了。
奧特曼:有些人說是提升了2倍、3倍,但我還沒聽到有多少人說達到了10倍這種程度。
主持人:但你覺得明年就可能達到這種“質變”?
奧特曼:預測,特別是帶有時間表的預測,總是很難。但我覺得我們可以把目標定在那里。
主持人:你知道這里面其實也有些負面因素。比如 Daniel Gross 曾經寫過一篇文章,說印度有 2500 億美元的出口是 IT 服務。站在這個角度想,有一天這些服務可能會被 GPT-4 或 GPT-5 的 token 替代。對印度來說,那 2500 億非常重要。而這些工程師中,不是所有人都能成為高端工程師,從而從這項技術中受益。有些人只是做簡單的 CRUD 應用,但他們面臨來自“使用 AI 的10倍程序員”的競爭。而且那些工程師的成本可能更低,因為 token 本身就便宜。你覺得印度該怎么做,才能在這個過程中保持相關性?
奧特曼:我覺得這是一個非常重要的問題。從整體來說,我相信世界對代碼的需求遠遠超過了我們現(xiàn)在的供給。我的看法是,世界非??释嗟能浖?,而現(xiàn)在正好到了爆發(fā)的時候。如果你給人們這些能大幅提高效率的工具,那些原本只能產出一定價值的開發(fā)者,將能創(chuàng)作出更高價值的產品。當然,他們要為 AI 支付一部分費用,所以不能獨占全部價值,而且代碼的市場價格可能也會下降。但我愿意打賭,這就是“杰文斯悖論”的又一個例子。
主持人:所以說,雖然單價會降,但需求也會同步提升,是吧?
奧特曼:我認為是這樣的。
主持人:聽你這么說還挺讓人安心的。
奧特曼:當然,不是所有行業(yè)都會這樣。但代碼這一塊,我確實是這么判斷的。
談Agent:消費級用例即將成為Agent射程
主持人:我們現(xiàn)在也能看到一些早期的智能體(Agent)了。比如 DeepResearch,真的挺棒的,但它還是偏被動,不會自動讀取我的卡片并執(zhí)行操作。像 DeepResearch 風險較低,但我們也看到你對 Agent 非??春茫芏喙疽彩?。那么你覺得,到今年年底或明年,我們會看到哪些 Agent 的實際用例?哪些會出現(xiàn)在日常生活中?
奧特曼:還是用編程的例子來講吧。你對一個編碼Agent說:“我想加個新功能”,然后它自己去處理,過一會兒回來給你個 PR(Pull Request),說“搞定了”。這種事情一旦成為現(xiàn)實,會讓人覺得非常瘋狂。還有其他類別,比如讓 Agent 去替你完成某些事,像是網絡運營方向就已經稍微展示了這種能力。我覺得代碼領域將會成為一個重要突破口。
主持人:那有沒有一些消費級的用例?比如點外賣、叫車這種。
奧特曼:這些正是我認為一定會發(fā)生的事。而且,它們看起來會非常像“Agent風格”的任務。
AI時代的職業(yè)發(fā)展:接觸新技術,為自己的職業(yè)生涯負責
主持人:那我再問你一個問題。假設你現(xiàn)在是一個普通員工,但你所在的公司是個傳統(tǒng)企業(yè),適應新技術很慢。他們可能試過 GPT-3,結果就覺得不過如此,后來就沒再管了。如果你在這樣的公司里,怎么勸都勸不動他們用新工具,你會怎么做?你會跳槽去一家動作更快但風險更高的公司嗎?
奧特曼:我大概會這么做。因為我覺得不采用這些新技術的公司,以后會處境艱難。當然,有些行業(yè)可能還能撐下去。但就我個人來說,我會為自己的職業(yè)負責,我希望不斷學習成長。如果我感覺自己無法接觸到這些工具,那這家公司就很“壞掉”了。
主持人:有道理。那最后一個問題你就可以解放啦:你這么多年做了很多事,從 YC 到 OpenAI,也投資了不少公司。你對 AI 有什么觀點是最開始相信的,但后來你的看法完全改變了?
奧特曼:我原本以為 AI 會對社會產生更劇烈的沖擊。我曾經有一個非常科幻的預想,覺得 AI 會徹底顛覆一切。也許未來確實會走向那一步,但目前,它只是一個超強的工具,生活的其他部分依舊照常運轉。其實我很高興這樣。我覺得這是好事,說明我當年想得太天真了。事實證明如果真發(fā)生那種巨變,也許反而是壞事。但無論如何,現(xiàn)在的現(xiàn)實和我十年前的預期大不一樣,而我覺得這樣反而很好。
主持人:我也覺得這樣挺好。如果我們真的能擁有“神一樣的技術”,能解決醫(yī)療問題,減少我們討厭的工作,反而讓我們多做喜歡的事,那一定是件好事。我也希望這項技術最終能造福所有人。
談印度擁抱AI:目前是OpenAI增長最快市場
主持人:那印度有沒有貢獻力量?至少從你發(fā)的內容來看,印度用戶非?;钴S。
奧特曼:我相信印度現(xiàn)在是我們增長最快的市場。印度對我們來說一直都非常特別,它是最早在美國之外大規(guī)模接受AI的市場之一。現(xiàn)在,我?guī)缀蹩梢钥隙ǎ俏覀冊鲩L速度最快的市場。
主持人:哇,那真是……
奧特曼:看到這一切真的很酷。
主持人:這太瘋狂了。那你看到印度用戶在用AI做其他事情嗎?比如深度研究?他們是愿意付費的市場嗎?
奧特曼:幾個月前我去了印度,那時圖像生成工具還沒發(fā)布。我?guī)缀醪煌5芈牭礁鞣N用戶故事,他們講自己怎么用ChatGPT,用GPT-4做了什么。AI已經深深滲透進了印度社會,用途非常廣泛。當然,也有用戶反饋我們的定價對印度市場的大規(guī)模普及來說太高了。我們也在研究解決辦法??上КF(xiàn)在我們的算力成本仍然很高,但我們正在努力開發(fā)更高效的模型,我很樂觀,未來我們能把成本降下來。
謝謝你,Sam,這次采訪非常精彩。謝謝你臨時抽時間做這個節(jié)目。希望印度能繼續(xù)熱情使用這些技術。
奧特曼:我毫不懷疑這點。我從來沒見過一個國家對技術的采納速度這么快。
主持人:太酷了。希望我們能繼續(xù)做更多,也希望你能看到時間線上出現(xiàn)越來越多你們創(chuàng)造的作品。