OpenAI播客再談AI編程大戰(zhàn)!開發(fā)者是有福的人:特定需求的代碼模型將涌現(xiàn)!主持人說漏嘴:我最喜歡Claude!
編譯、整理 | 伊風(fēng)
?出品 | 51CTO技術(shù)棧(微信號:blog51cto)
OpenAI第二期播客來了!陣容也是相當(dāng)重磅!
嘉賓是OpenAI 首席研究官 馬克·陳(Mark Chen)和ChatGPT 負責(zé)人 尼克·特利(Nick Turley)。主持人依然由OpenAI研究員Andrew?Mayne擔(dān)任。
說起Mark Chen,感覺他目前實際擔(dān)任了OpenAI CTO的工作。就在這兩天 Meta 大舉挖人、硅谷 AI 人才戰(zhàn)火正旺之際,Mark 第一個站出來穩(wěn)定軍心,在內(nèi)部 Slack 上發(fā)了一封強烈表態(tài)的備忘錄:
“我現(xiàn)在的感覺是強烈的、生理性的,就像有人闖進我們家偷走了什么東西?!薄罢埾嘈牛覀兘^沒有袖手旁觀。”
左:Nick Turley,右Mark Chen
這個博客有個很讓人震驚的小插曲,在提到最強編程模型的時候,主持Andrew?Mayne居然說自己喜歡Claude Sonnet……這播客,那么實在的嗎??
言歸正傳,這個播客還是有很多編程方面的猛料值得一看:
??OpenAI可謂AI編程的開山鼻祖:在 GPT-3 剛出現(xiàn)的時候,OpenAI就發(fā)現(xiàn)它能生成完整的 React 組件,并捕捉到了AI編程工具的潛力和需求。
??Agentic 編程應(yīng)該是異步式交互的:你給模型一個復(fù)雜任務(wù),讓它在后臺處理一段時間,再返回一個接近最佳的解法。
?? “寫出好代碼”仍然需要“品味”:OpenAI 也在訓(xùn)練模型理解代碼風(fēng)格。
?? OpenAI做產(chǎn)品的思路:從技術(shù)出發(fā),觀察誰能從中找到價值,然后再圍繞這些用戶進行迭代。
??Codex是一款面向?qū)I(yè)編程者的AI工具,未來還會有更加通用的消費級產(chǎn)品推出。
?? 別再盯著“崗位消失”不放了:打字機修理工的確消失了,某些傳統(tǒng)開發(fā)工作也會被替代,但“代碼能做的事”遠超想象。
“寫代碼這件事的空間,大得超乎你我的想象?!?/p>
1.編程模型不會一家獨大,“Agentic 編程”大有可為
主持人Andrew?Mayne:
在眾多令人驚喜的能力中,代碼一直是一個非常有意思的方向。我記得在 GPT-3 剛出現(xiàn)的時候,我們突然發(fā)現(xiàn)它能生成完整的 React 組件,當(dāng)時我們就意識到它是有實際用處的。之后我們專門訓(xùn)練了一個模型聚焦在代碼上,這就催生了 Codex 和 Code Interpreter?,F(xiàn)在 Codex 又以新的形式回來了,雖然名字一樣,但能力越來越強。
我們見證了代碼功能從最初進入 VS Code,然后到 Cursor、再到我經(jīng)常用的 Windsurf?,F(xiàn)在代碼領(lǐng)域的競爭壓力也很大。如果我們問大家誰擁有最強的代碼模型,可能會有不同答案。
Mark Chen:
沒錯,這其實也反映出一個事實——“編程”這個詞本身指涉范圍就很廣。比如你在 IDE 里寫代碼,需要函數(shù)補全,這和你提出一個 Pull Request 并讓 AI 完成整個任務(wù),是完全不同的兩種“編程方式”。
主持人Andrew?Mayne:
你能展開說說“Agentic 編程”具體是什么意思嗎?
Mark Chen:
當(dāng)然。你可以把它和“實時響應(yīng)型模型”做對比,比如 ChatGPT 的傳統(tǒng)方式是你給出一個提示,它很快就給你回應(yīng)。但 Agentic 編程更像是:你給模型一個復(fù)雜任務(wù),讓它在后臺處理一段時間,再返回一個接近最佳的解法。
我們越來越多地認為未來會是這種異步式交互:你提出一個復(fù)雜請求,然后讓模型花時間思考、推理,最終給你一個盡可能優(yōu)秀的結(jié)果。在代碼領(lǐng)域我們也看到這種演變。未來,你可能只需描述你想實現(xiàn)的功能,模型會處理后再回來給你完整解決方案。
我們的第一版 Codex 就體現(xiàn)了這個方向:它接收的是 PR 級別的大任務(wù),比如一個新功能或大范圍 bug 修復(fù),希望模型真正花時間來解決,而不是僅僅快速響應(yīng)。
Nick Turley:
是的,說到底,“編程”涵蓋范圍實在太廣,幾乎可以類比“知識工作”這種大詞。所以我不認為會有一個絕對贏家或最佳模型,而是有很多選擇。開發(fā)者其實是最幸運的一群人,他們現(xiàn)在能選擇非常多樣的工具。就我們而言,“Agentic 編程”是目前最令人興奮的方向之一。
我做產(chǎn)品時經(jīng)常用一個評估標準:“如果模型變強 2 倍,產(chǎn)品是否也會變得有 2 倍好用?” 過去 ChatGPT 的確做到了這一點。但當(dāng)模型越來越聰明,用戶不再只想和一個像博士生一樣的模型聊天,他們會開始在意模型的性格、實際能力等。
Codex 是一種理想的產(chǎn)品形態(tài):你定義任務(wù),模型花時間思考,然后產(chǎn)出結(jié)果。這種交互方式特別適合未來更強大的模型。雖然目前還是早期研究預(yù)覽階段,但正如我們當(dāng)初對 ChatGPT 的判斷一樣,我們認為越早獲取反饋越有意義,對未來很期待。
主持人Andrew?Mayne:
我之前常用 Sonnet(Claude),非常喜歡。后來我嘗試了 Windsurf,用的是 0.4 mini 或 medium 設(shè)置,我感覺特別好,響應(yīng)速度快、體驗也流暢。每個人都有喜歡的模型,這我理解,但就我用的任務(wù)來說,這是我第一次真正滿意。
Mark Chen:
我們發(fā)布這個其實是希望用戶能體驗到,我們也知道代碼領(lǐng)域還有很多“低垂的果實”可以探索。代碼是我們重點關(guān)注的方向,未來你會看到越來越多適配特定需求的代碼模型。
主持人Andrew?Mayne:
我現(xiàn)在如果只是想快速查個語法或?qū)懛?,就會?GPT-4.1 直接問。但對更復(fù)雜任務(wù),情況就不同了。評估方式其實已經(jīng)有點飽和了,而且每個人的標準也不一樣,所以要怎么適配各種需求是個挑戰(zhàn)。
Mark Chen:
尤其是代碼領(lǐng)域,不只是“能不能生成正確答案”。用戶還會在意代碼風(fēng)格、注釋的詳盡程度、模型是否主動做了額外的事情,比如寫好輔助函數(shù)等等。大家的偏好差異也很大,這需要我們在很多方面做得更好。
Nick Turley:
過去如果你問我哪些領(lǐng)域會最先被 AI 變革,我一定會說是代碼。因為和數(shù)學(xué)類似,它是可驗證、可打分的,非常適合強化學(xué)習(xí)。
2.編程的品味仍是最寶貴的
Nick Turley:
現(xiàn)在我依然這么認為,但讓我意外的是:代碼其實仍然包含大量“品位”層面的東西。一個人成為專業(yè)軟件工程師,不是因為智商變高了,而是因為他們學(xué)會了如何在團隊中構(gòu)建軟件——寫什么樣的測試,如何寫好文檔,別人不同意你代碼時該怎么回應(yīng)……
這些才是“真正的軟件工程”需要具備的內(nèi)容,我們也需要教會模型理解這些。所以我相信 AI 在代碼上的進步會很快,代碼仍然是一個非常適合做 Agentic 產(chǎn)品的領(lǐng)域,但“風(fēng)格”“品位”“真實開發(fā)實踐”這些也必須被考慮進去。
主持人Andrew?Mayne:
還有一點也很有趣:ChatGPT 現(xiàn)在面臨的挑戰(zhàn)之一是要在“消費者”和“專業(yè)用戶”之間找到平衡。我告訴朋友可以把 ChatGPT 連接到代碼模型,他們都覺得很神奇,比如讓它控制 IDE、自動創(chuàng)建文件夾、寫文檔這些,其實都能做。
現(xiàn)在我們有了圖像標簽、Codex 標簽,甚至可以通過 GitHub 使用模型。Sora 也整合進來了。你能看到這些功能在逐步融合:那我們該怎么區(qū)分消費級、專業(yè)級和企業(yè)級功能呢?
Nick Turley:
我們在做的是非常通用的技術(shù),它會被各種各樣的人使用。和很多公司不同的是,別的公司通常從一個特定用戶類型出發(fā),用技術(shù)來解決這個群體的問題;而我們更多是從技術(shù)出發(fā),觀察誰能從中找到價值,然后再圍繞這些用戶進行迭代。
以 Codex 為例,我們的初衷是面向?qū)I(yè)軟件工程師打造這個產(chǎn)品。但我們也知道,這種“濺射效應(yīng)”會波及很多其他用戶群體,他們也能從中受益,我們也會努力讓他們用起來更加便捷。
其實面向非工程師用戶還有很多機會。我個人非常希望能幫忙構(gòu)建一個“人人都能編程”的世界。Codex 不是面向大眾的產(chǎn)品,但你可以想象未來會出現(xiàn)這樣的工具。不過總的來說,我們很難一開始就準確預(yù)測目標用戶是誰,必須把這些通用技術(shù)推出去之后,才能用實證主義的方式觀察價值到底在哪兒。
Mark Chen:
是的,其實更深入一點來說,有些用戶可能主要用 ChatGPT 寫代碼,但他們偶爾也會想跟模型聊聊,或者想要生成一張漂亮的圖。所以雖然存在不同的用戶畫像,但在實際中,我們發(fā)現(xiàn)大家都希望模型具備多種能力。
3.內(nèi)部使用Codex:目標是讓工程師提效十倍
主持人Andrew?Mayne:
在 Codex 發(fā)布的時候,我有個印象很深的感受:有些工具之所以引發(fā)巨大興趣,是因為內(nèi)部團隊本身就有強烈需求。這種工具你們內(nèi)部用得多嗎?
Mark Chen:
越來越多了。
Nick Turley:
我對內(nèi)部使用 Codex 非常興奮。應(yīng)用場景非常廣,比如開發(fā)者用它來減少寫測試的負擔(dān),還有分析師用它處理日志報錯,自動標記問題并在 Slack 上通知相關(guān)人員。甚至有人用它當(dāng)作“待辦清單”的入口,提前把未來希望完成的任務(wù)發(fā)送給 Codex 處理。
我認為這類工具非常適合“內(nèi)部自測”(dogfooding),而且它確實能大幅提升開發(fā)效率。我們的目標是:不擴張人力的前提下,提高現(xiàn)有工程師的產(chǎn)出效率,理想狀態(tài)是讓一個工程師變成原來的十倍高效。從這個角度看,內(nèi)部使用情況對我們未來產(chǎn)品發(fā)展方向是非常重要的指標。
Mark Chen:
是的,我們不會發(fā)布自己都不愿意用的工具。在 Codex 上線前,內(nèi)部就有一些超級用戶,他們每天能用 Codex 寫出上百個 Pull Request,這說明我們內(nèi)部確實能從中獲得巨大價值。
Nick Turley:
而且內(nèi)部使用還有一個“現(xiàn)實校驗”的作用:人們都很忙,要引入新工具需要一定“激活成本”。你會發(fā)現(xiàn):當(dāng)我們試圖推廣某個工具時,要花時間讓大家適應(yīng)新的工作流,這個過程其實挺謙卑的。我們既能從中了解技術(shù)的局限,也能看到“采用路徑”的實際阻力。
4.適應(yīng)AI時代的秘密武器:好奇心、主動性
主持人Andrew?Mayne:
確實,構(gòu)建這類工具時,團隊成員要花時間去學(xué)習(xí)和適應(yīng)它?,F(xiàn)在有個熱門話題是:未來需要什么樣的技能?你們在組建團隊時會更看重什么能力?
Nick Turley:
這個問題我思考過很多。招聘確實很難,尤其是你想組建一個小而強、謙遜且執(zhí)行力極強的團隊時。我最看重的能力是好奇心。
很多學(xué)生問我,在一個快速變化的世界里該怎么辦?我給他們的建議就是:好奇心是關(guān)鍵。我們自己其實也有很多不知道的地方,必須帶著謙遜的態(tài)度深入研究,去理解什么是有價值的、什么是有風(fēng)險的。
尤其是在 AI 相關(guān)的工作中,不管是代碼、還是其他方面,其實真正的瓶頸不是獲取答案,而是提出對的問題。所以我非常相信我們需要招聘那些對世界和我們所做的事情充滿好奇的人。
至于是否有 AI 背景,我其實沒那么在意。當(dāng)然 Mark(Mark Chen:)可能觀點會不同。但對我來說,產(chǎn)品團隊的成功與否,很大程度上取決于好奇心的強弱。
Mark Chen:
我其實也差不多。就連研究方向,現(xiàn)在也越來越不強調(diào)一定得有 AI 博士學(xué)位。我自己就是以“駐留研究員”身份加入的,當(dāng)時沒有什么正式的 AI 訓(xùn)練背景。
我覺得 Nick 提到的很對,另一個重要素質(zhì)是“主動性”。OpenAI 不是那種每天都有人告訴你:“今天你要做這三件事”的地方,而是你得看到問題、主動跳進去解決它。
還有就是適應(yīng)性。這個行業(yè)變化非常快,所以你必須能迅速判斷什么是重要的、什么時候該調(diào)整方向、該怎么轉(zhuǎn)變工作重點。
Nick Turley:
的確,我們常被問“OpenAI 怎么能持續(xù)發(fā)布產(chǎn)品”,很多人覺得我們幾乎每周都在發(fā)布新東西。但我們自己從未覺得速度夠快,反而常覺得可以更快。
真正的原因是:我們擁有大量有執(zhí)行力的人,不管是產(chǎn)品、研究還是政策團隊,大家都能推動項目向前。雖然“發(fā)布”在不同團隊里意義不同,但我們減少不必要的官僚流程,除了在極個別需要嚴格流程的領(lǐng)域外,大多數(shù)時間我們能快速推進,這也是我們想招聘的理想人才類型。
主持人Andrew?Mayne:
我當(dāng)初加入公司,是因為最早拿到 GPT-3 的訪問權(quán)限,然后開始做各種 demo,每周發(fā)視頻。雖然有時可能挺煩人的(笑),但我真的非常興奮。
Mark Chen:
不煩,反而很有趣。
主持人Andrew?Mayne:
那段時間真的讓人興奮。我跟別人描述時說,就像他們造了一艘 UFO,而我能玩它。比如我看到它能“懸?!保揖陀X得:“哇,他們真的讓它飛起來了!”我只是按了按鈕而已,但感受到的力量是真實的。
我是自學(xué)寫代碼的,看了很多 Udemy 課程,然后能作為工程團隊一員,被鼓勵“自己去做點什么”,雖然不是核心工作,也沒搞壞什么(笑),但這份自由讓我感到被賦能。
我覺得這種精神至今還在,這也是 OpenAI 能不斷推進產(chǎn)品的原因之一。畢竟 GPT-4 是由 150 到 200 人一起完成的。
主持人Andrew?Mayne:
我覺得大家常常忘了這件事。
Nick Turley:
完全同意。實際上,連 ChatGPT 也是這樣“拼湊”起來的。一開始是研究團隊在做“指令跟隨”相關(guān)的研究,之后的模型也延續(xù)了這條路線,通過后訓(xùn)練讓模型更適合對話。而 ChatGPT 的產(chǎn)品原型,其實是一個黑客松(hackathon)項目。
我記得很清楚,我們當(dāng)時問大家:“誰想做消費級產(chǎn)品?”然后各種背景的人都加入了進來——比如有來自超級計算團隊的人說,“我之前做過 iOS 應(yīng)用,我來做”;也有研究員來寫后端代碼。這是一個“想做點事”的人的交匯點。
我認為,能讓這種事發(fā)生的組織文化,是誕生下一個 ChatGPT 的關(guān)鍵,也是我們在組織規(guī)模不斷擴張時要維持下去的東西。
主持人Andrew?Mayne:
我們之前提到,團隊招人時會關(guān)注“好奇心”,Mark 也認同這一點。如果我是個 AI 行業(yè)外的人,比如 25 歲或 50 歲,面對技術(shù)飛速發(fā)展可能會感到有些害怕,特別是像 ChatGPT 在寫作、編程上表現(xiàn)得這么好。
但我個人認為,永遠不會有足夠多的“寫代碼的人”,因為代碼可以實現(xiàn)的事情,比我們能想象的還要多。
5.不要擔(dān)心被取代:寫代碼這件事的空間大得超乎想象
主持人Andrew?Mayne:
那么你們會給普通人什么建議呢?不論他們處于人生哪一階段,該如何準備、適應(yīng)并參與這個 AI 未來?
Mark Chen:
我覺得最重要的是你要意識到,你的能力可以被增強——AI 能讓你更高效、更有影響力。
未來,專家仍然會存在,但 AI 幫助最大的其實是那些本身并不具備高級技能的人。舉個例子,如果模型能提供更好的醫(yī)療建議,它最能幫助的,其實是那些無法獲得高質(zhì)量醫(yī)療資源的人。
圖像生成也一樣,它不是替代專業(yè)藝術(shù)家,而是讓像我和 Nick 這樣的人也能做出有創(chuàng)意的表達。
AI 提供的,是一種“能力提升的基礎(chǔ)設(shè)施”,讓普通人能勝任很多本來不擅長的事。
Nick Turley:
未來的確會發(fā)生很大變化。我覺得幾乎每個人都會有那么一刻,AI 做了一件你原本認為“神圣而人類獨有”的事情。
主持人Andrew?Mayne:
我認識一個做投資的人,當(dāng)他的工作內(nèi)容被 AI 替代后感到非常受威脅。
Mark Chen:
沒錯,現(xiàn)在有些模型在寫代碼、解決問題方面,確實比我強。
Nick Turley:
這是很人之常情的反應(yīng)。面對這種強大系統(tǒng)時,我們會感到敬畏,也可能感到恐懼。
就像 Mark 說的,你需要親自使用它,才能真正理解它、降低恐懼感。
我們很多人從小就聽說“人工智能”,但那個時候說的是算法、廣告推薦,或是電影里的機器人,對不同人來說,AI 意味著不同的東西。因此,感到害怕一點都不奇怪。
要想和別人進行有建設(shè)性的對話,最好的方式就是親自去用 AI。
至于如何為未來做準備,我認為不一定要去鉆研什么提示詞工程或 AI 編程原理。
反而更重要的,是那些本質(zhì)的人類能力,比如“如何委托任務(wù)”。
你將擁有一個“放在口袋里的智能體”,它可以是你的導(dǎo)師、顧問、工程師。真正的關(guān)鍵是:你是否了解你自己,知道你要解決什么問題,以及別人能如何幫你。
Nick Turley:
我之前也說過,好奇心很重要。你能問出什么問題,就能獲得什么樣的結(jié)果。除此之外,持續(xù)學(xué)習(xí)的能力也非常關(guān)鍵。
你越能快速學(xué)習(xí)新領(lǐng)域、新知識,就越能適應(yīng)這個變化速度前所未有的世界。我自己也準備好接受:未來某一天,我現(xiàn)在做的產(chǎn)品經(jīng)理角色可能會消失。但我也期待去學(xué)點新東西。如果你有這種心態(tài),那你就能很好地利用 AI。
主持人Andrew?Mayne:
我們有時候會過度強調(diào)某些崗位的消失,比如我們不再需要打字機修理工了。某些類型的編程崗位也會消失。
但我還是那句話:寫代碼這件事的空間大得超乎想象。
你們剛才提到了醫(yī)療行業(yè),有人會擔(dān)心 AI 替代醫(yī)生。但我其實樂意讓 AI 來給我診斷、動手術(shù),甚至處理很多事情。
但我還是希望有個人陪我聊聊、解釋手術(shù)流程、握著我的手。我每天都吃很多維生素,但我不可能每天因為這些小事去問醫(yī)生,對吧?
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,編譯、整理 :伊風(fēng)
