OpenAI離職員工自曝:干了一年就潤(rùn)了!007壓力逼到極限,AGI成宗教
外界對(duì)于OpenAI眾說(shuō)紛紜,很少有人從內(nèi)部視角描述它的真實(shí)文化。
三周前,在推出Codex后,Calvin French-Owen離開了OpenAI。
在2024年5月,他加入了OpenAI,全程見證了OpenAI編程智能體Codex的誕生。
如今,Calvin French-Owen想趁熱打鐵,效仿Nabeel Quereshi的《對(duì)Palantir的反思》,揭秘OpenAI的獨(dú)特之處。
沒(méi)有任何商業(yè)機(jī)密,更多的是他對(duì)當(dāng)下歷史性時(shí)刻的思考——在當(dāng)前階段,關(guān)于這個(gè)史上最迷人組織之一所呈現(xiàn)的樣貌。
首先澄清:離開OpenAI并非因?yàn)閭€(gè)人矛盾,實(shí)際上他對(duì)這個(gè)決定非常糾結(jié)。
從創(chuàng)業(yè)公司創(chuàng)始人,轉(zhuǎn)變?yōu)橐患?000人規(guī)模企業(yè)的員工,這個(gè)角色轉(zhuǎn)變并不容易。
現(xiàn)在,他渴望一個(gè)全新的開始。
但這份優(yōu)質(zhì)的工作完全有可能再次吸引他回來(lái)。
構(gòu)建AGI是無(wú)與倫比的使命,LLM無(wú)疑是這十年最重要的技術(shù)突破。
他很幸運(yùn)能親眼見證一些技術(shù)進(jìn)展,并參與了Codex的發(fā)布。
當(dāng)然,這些僅為個(gè)人觀點(diǎn),不代表公司立場(chǎng)。OpenAI海闊天空,這只是管中窺豹的一瞥。
深度揭秘OpenAI文化
首先,要了解的是OpenAI的發(fā)展速度之快。
2024年5月,他加入時(shí),OpenAI大約有1000多人。
一年后,員工數(shù)暴增至3000多人,他的工齡竟然排在前30%。
幾乎所有領(lǐng)導(dǎo)層如今負(fù)責(zé)的工作,都與他們兩三年前的大相徑庭。
如此快速的擴(kuò)張導(dǎo)致許多機(jī)制出現(xiàn)問(wèn)題:內(nèi)部溝通、組織架構(gòu)、產(chǎn)品發(fā)布流程、人員管理和招聘體系等,都在不斷調(diào)整。
不同團(tuán)隊(duì)的文化差異顯著:有的團(tuán)隊(duì)全力沖刺,有的負(fù)責(zé)大型計(jì)算任務(wù),有的則節(jié)奏更平穩(wěn)。
因此,OpenAI的體驗(yàn)因團(tuán)隊(duì)而異,研究、應(yīng)用和市場(chǎng)團(tuán)隊(duì)的工作節(jié)奏完全不同。
Slack驅(qū)動(dòng)一切
OpenAI的獨(dú)特之處在于,所有事情——沒(méi)錯(cuò)就是指所有事情——都依賴Slack運(yùn)轉(zhuǎn)。
幾乎所有工作都在Slack上完成,沒(méi)有電子郵件。
如果不擅長(zhǎng)信息管理,這種模式會(huì)讓你分心到崩潰;但如果精心規(guī)劃頻道和通知設(shè)置,這套系統(tǒng)其實(shí)相當(dāng)高效。
OpenAI的文化非?!缸韵露稀?,尤其是在研究領(lǐng)域。
剛加入時(shí)詢問(wèn)下一季度的路線圖,他得到的回答是:「沒(méi)有路線圖」(現(xiàn)在有了)。
好的想法可以來(lái)自任何地方,很難提前預(yù)測(cè)哪個(gè)想法會(huì)成功。
相比宏大的總體計(jì)劃,OpenAI的進(jìn)展靠不斷試錯(cuò)和研究突破推動(dòng)。
得益于這種文化,OpenAI也極為推崇「實(shí)力至上」。
公司領(lǐng)導(dǎo)者的晉升主要基于他們提出好點(diǎn)子并付諸實(shí)踐的能力。
許多優(yōu)秀領(lǐng)導(dǎo)并不擅長(zhǎng)演講或辦公室政治,但在OpenAI,這不是重點(diǎn)。
真正的好想法往往能脫穎而出。
行動(dòng)導(dǎo)向!
公司鼓勵(lì)直接行動(dòng)。不同團(tuán)隊(duì)常不約而同地探索類似想法。
剛加入時(shí),他參與了一個(gè)與ChatGPT Connectors類似的內(nèi)部項(xiàng)目。
Codex發(fā)布前,內(nèi)部有3-4個(gè)不同的原型項(xiàng)目,通常由幾個(gè)人自發(fā)啟動(dòng),無(wú)需特別審批。
一旦顯現(xiàn)出潛力,團(tuán)隊(duì)便會(huì)迅速圍繞它們集結(jié)起來(lái)。
Codex負(fù)責(zé)人Andrey曾說(shuō),研究員就像獨(dú)立的小高管,獨(dú)立探索項(xiàng)目。
優(yōu)秀的研究經(jīng)理和項(xiàng)目經(jīng)理(PM)影響力巨大,同時(shí)也極為稀缺。
最頂尖的經(jīng)理能將眾多不同的研究項(xiàng)目串起來(lái),推動(dòng)更大規(guī)模的模型訓(xùn)練。
他合作的ChatGPT工程經(jīng)理非常沉穩(wěn),他們大多放手管理,但擅長(zhǎng)招聘優(yōu)秀人才,并盡力為他們創(chuàng)造成功的條件。
OpenAI能快速調(diào)整戰(zhàn)略方向,決策調(diào)整非常迅速。
這是創(chuàng)業(yè)時(shí)就很看重的:根據(jù)新信息做正確的事,遠(yuǎn)比固守計(jì)劃重要。
令人驚訝的是,OpenAI這樣的大公司仍保持這種靈活性,谷歌顯然做不到。
一旦決定某個(gè)方向,公司會(huì)全力以赴。
OpenAI備受外界關(guān)注。內(nèi)部尚未公布的消息常被媒體提前曝光。甚至有X用戶用腳本監(jiān)控OpenAI的新功能發(fā)布。
因此,公司內(nèi)部非常注重保密,無(wú)法詳細(xì)透露工作內(nèi)容。
Slack工作空間有不同權(quán)限,收入和支出數(shù)據(jù)更是嚴(yán)格保密。
OpenAI也比你想象的要嚴(yán)肅,這里的風(fēng)險(xiǎn)和機(jī)遇都太大了。
一方面,公司追求AGI,責(zé)任重大;另一方面,產(chǎn)品服務(wù)數(shù)億用戶,涵蓋醫(yī)療建議到心理咨詢等場(chǎng)景。
盡管OpenAI常被媒體批評(píng),他遇到的每個(gè)同事都在努力做正確的事。
作為最受關(guān)注的AI實(shí)驗(yàn)室,OpenAI容易招致批評(píng)。
不應(yīng)該將OpenAI視為單一的整體。
它最初是一群科學(xué)家和技術(shù)愛好者,共同探索科學(xué)的前沿。
這個(gè)團(tuán)體偶然間催生了歷史上最具病毒傳播效應(yīng)的消費(fèi)級(jí)應(yīng)用。隨后,它又萌生了向政府和企業(yè)銷售產(chǎn)品的雄心。
因此,不同時(shí)期加入、身處不同部門的員工,其目標(biāo)和視角也大相徑庭。
待得越久,就越可能傾向于從「研究實(shí)驗(yàn)室」或「非營(yíng)利組織」的視角看待公司。
積極分享成果
最欣賞的一點(diǎn)是,公司在分享AI成果方面,是真正地說(shuō)到做到。
頂尖模型沒(méi)有被限制在高價(jià)企業(yè)套餐中,任何人都能免費(fèi)使用ChatGPT獲取答案。
API向初創(chuàng)公司開放,最先進(jìn)的模型通常很快接入API。
這一點(diǎn)OpenAI值得高度贊揚(yáng),也是公司文化的核心。
OpenAI對(duì)安全的重視超出外界猜測(cè)。
許多人在開發(fā)安全系統(tǒng),重點(diǎn)關(guān)注實(shí)際風(fēng)險(xiǎn)(如仇恨言論、濫用、政治偏見、生物武器、自我傷害、提示注入等),而非理論風(fēng)險(xiǎn)(如智能爆炸)。
安全方面的工作大多未公開,OpenAI應(yīng)更積極分享這方面成果。
紀(jì)念品稀缺:不像其他公司大肆發(fā)放紀(jì)念品,OpenAI的紀(jì)念品限量分發(fā)。第一次投放需求太大,Shopify商店直接崩潰。內(nèi)部還流傳了如何用JSON繞過(guò)限制的教程。
GPU成本驚人:相比GPU開支,其他成本幾乎微不足道。比如,Codex一個(gè)功能模塊的GPU成本,就相當(dāng)于我們整個(gè)Segment基礎(chǔ)設(shè)施的開支。
雄心勃勃:OpenAI可能是最有野心的組織。不僅滿足于頂級(jí)消費(fèi)級(jí)應(yīng)用,還想在API、深度研究、硬件、代碼代理、圖像生成等多個(gè)領(lǐng)域競(jìng)爭(zhēng)。這里是實(shí)現(xiàn)想法的沃土。
X驅(qū)動(dòng):公司很關(guān)注X。病毒式傳播的OpenAI相關(guān)內(nèi)容常被內(nèi)部注意到。朋友開玩笑說(shuō):這家公司靠X氛圍驅(qū)動(dòng)。
團(tuán)隊(duì)流動(dòng)性:團(tuán)隊(duì)協(xié)作非常靈活。Codex發(fā)布時(shí),需要ChatGPT工程師支持,第二天就來(lái)了兩位高手加入,沒(méi)有繁瑣的審批流程。
高管參與度高:領(lǐng)導(dǎo)層非常投入,gdb、sama、kw、mark、dane等人常在Slack上發(fā)言,沒(méi)有甩手掌柜式的領(lǐng)導(dǎo)。
代碼與技術(shù)棧
OpenAI使用一個(gè)龐大的單一代碼庫(kù)(monorepo),以Python為主,但也加入了Rust(用于部分服務(wù))和Golang(用于網(wǎng)絡(luò)代理等)。
由于Python的靈活性,代碼風(fēng)格差異很大:既有谷歌十年老兵設(shè)計(jì)的可擴(kuò)展庫(kù),也有剛畢業(yè)的博士寫的臨時(shí)Jupyter筆記本。
API開發(fā)主要依賴FastAPI,數(shù)據(jù)驗(yàn)證用Pydantic,但公司沒(méi)有統(tǒng)一的代碼風(fēng)格規(guī)范。
OpenAI的全部基礎(chǔ)設(shè)施運(yùn)行在Azure上,只有三項(xiàng)服務(wù)被認(rèn)為是可靠的:
- Azure Kubernetes Service:用于容器管理。
- CosmosDB:Azure的文檔存儲(chǔ)。
- BlobStore:用于對(duì)象存儲(chǔ)。
OpenAI較少依賴自動(dòng)擴(kuò)展單元,權(quán)限管理(IAM)功能也比AWS更受限。公司傾向于「自研優(yōu)先」。
在工程團(tuán)隊(duì)中,有大量從Meta(包括Instagram)跳槽到OpenAI的人才。
OpenAI在很多方面類似早期Meta:擁有現(xiàn)象級(jí)消費(fèi)應(yīng)用、基礎(chǔ)設(shè)施尚在發(fā)展、追求快速行動(dòng)。
這些Meta背景的工程師為OpenAI帶來(lái)了強(qiáng)大的基礎(chǔ)設(shè)施經(jīng)驗(yàn),也導(dǎo)致OpenAI的基礎(chǔ)設(shè)施有些Meta的影子,比如:
- 自研了類似Meta TAO的系統(tǒng)(用于圖數(shù)據(jù)庫(kù))。
- 在網(wǎng)絡(luò)邊緣整合身份認(rèn)證的嘗試。
代碼為王(Code wins)
OpenAI沒(méi)有中央架構(gòu)或規(guī)劃委員會(huì),決策通常由執(zhí)行工作的團(tuán)隊(duì)做出,這帶來(lái)強(qiáng)烈的行動(dòng)導(dǎo)向,但也導(dǎo)致代碼庫(kù)中存在大量重復(fù)功能。
例如,至少有六種隊(duì)列管理和代理循環(huán)的庫(kù)。
值得稱贊的是,內(nèi)部團(tuán)隊(duì)正投入大量精力來(lái)改善這一狀況。
消費(fèi)級(jí)品牌的運(yùn)作
OpenAI以「專業(yè)訂閱」(pro subs)為核心衡量指標(biāo)。
即使是Codex這樣的產(chǎn)品,也主要考慮個(gè)人用戶而非團(tuán)隊(duì)使用。這對(duì)于B2B/企業(yè)背景的人來(lái)說(shuō)有點(diǎn)顛覆認(rèn)知。
產(chǎn)品上線第一天就能吸引大量流量,令人震撼。
大模型訓(xùn)練
訓(xùn)練過(guò)程介于「實(shí)驗(yàn)」和「工程」之間:
- 初期是小規(guī)模實(shí)驗(yàn),調(diào)整核心算法和數(shù)據(jù)組合,仔細(xì)分析結(jié)果。
- 如果實(shí)驗(yàn)結(jié)果有潛力,會(huì)被納入更大規(guī)模的訓(xùn)練。
- 大規(guī)模訓(xùn)練類似分布式系統(tǒng)工程,會(huì)遇到各種意外情況,需要不斷調(diào)試。
Codex發(fā)布
過(guò)去三個(gè)月,他參與了Codex的發(fā)布,這無(wú)疑是職業(yè)生涯的亮點(diǎn)之一。
2024年11月,OpenAI定下2025年推出編程智能體的目標(biāo)。
到2025年2月,內(nèi)部已有幾個(gè)工具效果不錯(cuò),市場(chǎng)對(duì)編程智能體的需求日益明確,模型在編程任務(wù)上已非常實(shí)用。
他提前結(jié)束陪產(chǎn)假,加入Codex發(fā)布工作。
回歸一周后,兩支團(tuán)隊(duì)合并,開始了瘋狂沖刺。
從第一行代碼到產(chǎn)品上線,僅用了7周!
Codex的開發(fā)是近十年來(lái)最艱苦的工作。
每天工作到深夜11點(diǎn)或凌晨,早上5:30被新生兒吵醒,7點(diǎn)到辦公室,周末也幾乎都在工作。
整個(gè)團(tuán)隊(duì)全力以赴,每一周都至關(guān)重要,感覺像回到了Y Combinator的創(chuàng)業(yè)節(jié)奏。
這種速度令人嘆為觀止。從未見過(guò)任何組織(無(wú)論大小)能在如此短的時(shí)間內(nèi)從想法到免費(fèi)上線的完整產(chǎn)品。
Codex構(gòu)建了容器運(yùn)行時(shí)、優(yōu)化了代碼庫(kù)下載、微調(diào)了代碼編輯模型、支持了各種Git操作、引入了全新功能界面、啟用了網(wǎng)絡(luò)訪問(wèn)。
最終打造了一款讓用戶用起來(lái)得心應(yīng)手、體驗(yàn)極佳的產(chǎn)品。
OpenAI依然保有那種全力以赴、快速發(fā)布產(chǎn)品的沖勁。
對(duì)的人聚在一起,真的能創(chuàng)造奇跡。
團(tuán)隊(duì)有8名資深工程師、4名研究員、2名設(shè)計(jì)師、2名市場(chǎng)人員和1名項(xiàng)目經(jīng)理。
如果有機(jī)會(huì)與Codex團(tuán)隊(duì)的成員共事,他們每一個(gè)人都非常出色。
發(fā)布之夜
發(fā)布前夜,五個(gè)人一直熬到凌晨4點(diǎn),部署巨大的單體服務(wù)(一個(gè)耗時(shí)數(shù)小時(shí)的流程)。
早上8點(diǎn),他們回到辦公室進(jìn)行發(fā)布直播,打開功能開關(guān)后,流量迅速涌入。
他從未見過(guò)一個(gè)產(chǎn)品僅靠出現(xiàn)在ChatGPT側(cè)邊欄就立即獲得如此大的流量——這就是ChatGPT的力量。
Codex采用完全異步的形式。
與當(dāng)時(shí)的Cursor或Claude Code不同,團(tuán)隊(duì)希望用戶能像與同事合作一樣使用編程智能體:發(fā)送任務(wù),代理在獨(dú)立環(huán)境中運(yùn)行,完成后返回拉取請(qǐng)求(PR)。
這是一個(gè)大膽的嘗試。當(dāng)前模型雖好,但還不夠完美,能運(yùn)行幾分鐘但無(wú)法持續(xù)幾小時(shí)。
用戶對(duì)模型能力的信任度千差萬(wàn)別,甚至不清楚模型的真正的上限在哪里。
Codex在處理大型代碼庫(kù)時(shí)表現(xiàn)優(yōu)異,能很好地理解和導(dǎo)航代碼結(jié)構(gòu)。
與其他工具相比,它最大的優(yōu)勢(shì)是能同時(shí)啟動(dòng)多個(gè)任務(wù),并比較它們的輸出結(jié)果。
公開數(shù)據(jù)顯示,Codex自發(fā)布以來(lái)生成了63萬(wàn)個(gè)PR,平均每個(gè)工程師在53天內(nèi)貢獻(xiàn)了約7.8萬(wàn)個(gè)公開PR(私有PR的數(shù)量可能更多)。
這可能是他職業(yè)生涯中最具影響力的項(xiàng)目。
坦白說(shuō),最初加入OpenAI時(shí)有些猶豫。
放棄創(chuàng)業(yè)者的自由、接受管理、成為大機(jī)器中的小齒輪,他不確定能否適應(yīng)。
如果創(chuàng)業(yè)者感到停滯不前,可以:
- 深入反思如何能進(jìn)行更多、更大膽的嘗試;
- 加入一家頂級(jí)的AI實(shí)驗(yàn)室。現(xiàn)在是投身創(chuàng)造的絕佳時(shí)機(jī),也是窺探未來(lái)的絕佳時(shí)機(jī)。
目前,通向AGI的競(jìng)爭(zhēng)三足鼎立:OpenAI、Anthropic和Google。
公司路徑因其DNA不同(消費(fèi)級(jí)產(chǎn)品 vs. 企業(yè)級(jí)服務(wù) vs. 堅(jiān)如磐石的基礎(chǔ)設(shè)施+數(shù)據(jù)),在其中任何一家工作,都將是大開眼界的經(jīng)歷。