編輯 | 伊風(fēng)
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
OpenAI 前員工的萬字離職帖,在海外技術(shù)社區(qū)刷屏了!
作者 Calvin French-Owen 把「從初創(chuàng)企業(yè)CTO到OpenAI 工程師」的 14 個月,寫成了一篇既熱血又克制的“內(nèi)部紀錄片”:
? 7 周極限沖刺,上線 Codex,上線當天凌晨 4 點還在部署;
? 一年擴張幾千人,代碼庫秒變“巨型垃圾場”;
? 第一天打開開關(guān),流量就涌進來,“從沒見過這么離譜的冷啟動”
為什么刷屏?就像作者說得那樣:外界關(guān)于 OpenAI 的傳聞太多,真正從“里面”走出來講真點一手體驗的人太少。
更有意思的是作者Calvin的身份。作為 Segment 的聯(lián)創(chuàng)兼 CTO(Segment 是家做客戶數(shù)據(jù)平臺的公司,2020 年被 Twilio 32 億美元收購),他早已習(xí)慣“自己說了算”的創(chuàng)業(yè)節(jié)奏。因此加入 OpenAI 前,他一度忐忑:
“擔心失去自由、擔心有老板、擔心變成大機器里的一顆螺絲。我低調(diào)入職,隨時準備跑路。”
離開時,他卻寫:
“回望這一年,這大概是我做過最正確的決定之一——想不出還有哪兒能讓我學(xué)得更多。”
他總結(jié)道,自己從這段經(jīng)歷里學(xué)到最珍貴的三樣?xùn)|西:
- 建立對模型訓(xùn)練與能力走向的直覺
- 與一群頂尖聰明的人共事并向他們學(xué)習(xí)
- 親手發(fā)布一款好產(chǎn)品
他甚至建議公司創(chuàng)始人都可以在大廠深造下:
“如果你是一位創(chuàng)始人,覺得自家 startup 毫無起色,要么 1)重新思考如何增加射門次數(shù),要么 2)直接加入三大實驗室之一。現(xiàn)在既是創(chuàng)業(yè)的黃金期,也是窺見未來的黃金期。
在我看來,AGI 競速目前是三駕馬車:OpenAI、Anthropic、Google。三家基因不同(消費者 vs 企業(yè) vs 基礎(chǔ)設(shè)施+數(shù)據(jù)),路線也必然不同。去任何一家,都會大開眼界?!?/span>
網(wǎng)友調(diào)侃說,扎克伯格看到三駕馬車的評論會哭暈在廁所里。
評論區(qū)另一個熱評則真誠地評論道,
“很少看到前員工把自己的工作經(jīng)歷說得這么正面。大多數(shù)人只是解釋為什么自己跟組織不合適,然后把鍋全甩給組織。
換個角度看:原文說的“極度自下而上”的另一面,就是有人會因為沒有路線圖、沒有明確劃分給他們負責(zé)的東西而感到迷茫;同理,“行動導(dǎo)向”和“說變就變”的另一面,就是一切混亂,高管層面缺乏一貫愿景?!?/span>
也許,沒有哪家公司是完美的;正因如此,看一位連續(xù)創(chuàng)業(yè)者如何切換身份,在 AGI 競速最前線學(xué)習(xí)、適應(yīng)、再出發(fā),才格外有價值。
那么,OpenAI 內(nèi)部到底長什么樣?我們沿著 Calvin 的萬字長文,拆給你看。
01、OpenAI 內(nèi)部文化速寫:自驅(qū)、迭代與速度感
在 OpenAI 工作,首先感受到的是它驚人的擴張速度。一年時間,公司人數(shù)從 1000 漲到 3000,流程和組織架構(gòu)頻頻“踩雷”,但也因此形成了一種極度自驅(qū)的文化:想到就做,撞車也不稀奇。多個 Codex 原型曾在內(nèi)部并行推進,ChatGPT Connectors 也經(jīng)歷了類似的演化過程。
OpenAI 幾乎只用 Slack,郵件稀少。高效溝通的關(guān)鍵是頻道管理,否則容易被信息吞沒。研究側(cè)極為“自下而上”,好點子可以來自任何人,“計劃”往往在事后補上。正因如此,這里特別重視實際落地能力,而非演講水平或政治手腕。
公司文化“唯才是舉”,研究員被視為“迷你 CEO”,靠“被問題勾住”驅(qū)動前行。最好的研究經(jīng)理和工程經(jīng)理,能把看似雜亂的探索組織成一次成功的大模型訓(xùn)練。
令人驚訝的是,這樣一家 3000 人公司,依舊能“說轉(zhuǎn)就轉(zhuǎn)”——方向變了,大家立刻 all-in。行動力驚人,氛圍高度依賴 Twitter,內(nèi)部甚至?xí)蛲獠勘钔莆亩{(diào)整節(jié)奏。
保密機制極其嚴格,Slack 拆分多個 workspace,敏感信息分級管理。與外界形象不同,OpenAI 內(nèi)部比想象中更嚴肅:它同時承擔著“做出 AGI”“服務(wù)數(shù)億用戶”與“參與全球技術(shù)競賽”的多重壓力。
OpenAI 可能是我見過野心最嚇人的組織。你以為手握全球頂級消費者應(yīng)用就夠了?它還想在 API、深度研究、硬件、編程代理、圖像生成,以及若干尚未公布的賽道全面競爭。這是一片能把點子直接跑到落地的沃土。
公司對 Twitter 的關(guān)注極高。如果你發(fā)的 OpenAI 相關(guān)推文爆了,大概率有人內(nèi)部看到并討論。朋友笑稱:“這家公司靠 Twitter vibe 運行?!弊鳛橄M者公司,也許并不夸張。數(shù)據(jù)指標當然有,但“氛圍”同樣重要。
02、代碼風(fēng)格千奇百怪,公司喜歡“自己造輪子”
OpenAI 使用一個巨型單倉庫,語言主要是 Python(不過 Rust 服務(wù)正快速增加,還有少量 Golang 服務(wù)負責(zé)網(wǎng)絡(luò)代理)。這導(dǎo)致代碼風(fēng)格千奇百怪:既有 10 年 Google 老兵寫的可擴展庫,也有剛出爐的博士隨手扔的 Jupyter Notebook。幾乎所有接口都用 FastAPI 搭,校驗靠 Pydantic;但全公司層面沒有強制統(tǒng)一的代碼風(fēng)格指南。
基礎(chǔ)設(shè)施全跑在 Azure 上。有趣的是,我只敢把下面三樣服務(wù)稱為“靠譜”:Azure Kubernetes Service、CosmosDB(文檔庫)和 BlobStore。這里沒有 Dynamo、Spanner、Bigtable、BigQuery、Kinesis 或 Aurora 的“真等價物”。大家也不太習(xí)慣用自動伸縮單元;IAM 功能比 AWS 簡陋得多;于是公司傾向于“自己造輪子”。
在工程人員構(gòu)成上,Meta → OpenAI 是一條非常明顯的輸送管道。很多方面,OpenAI 都像早期 Meta:現(xiàn)象級消費者應(yīng)用 + 稚嫩基礎(chǔ)設(shè)施 + 極致速度。我從 Meta/Instagram 挖過來的那批基礎(chǔ)設(shè)施人才,質(zhì)量普遍極高。
把這些因素放到一起,你會發(fā)現(xiàn)公司很多核心基礎(chǔ)設(shè)施都帶著“Meta 味”:有人重寫了 TAO;有人在邊緣統(tǒng)一身份認證;肯定還有更多我不知道的項目。
“對話”這一概念深入骨髓。自從 ChatGPT 爆火,代碼庫大量圍繞“消息-會話”原語設(shè)計。它們已經(jīng)固若金湯,如果你忽視它們,多半會吃苦頭。Codex 稍微偏離了一點(更多借鑒 responses API),但仍復(fù)用了很多前人成果。
代碼即真理。與其等一個中央架構(gòu)委員會拍板,不如誰動手誰說了算。結(jié)果是行動飛起,也導(dǎo)致大量重復(fù)輪子——光排隊管理、agent loop 這類庫我就見過不下六七個。
工程團隊極速膨脹,卻缺少配套工具,于是踩了不少坑:sa-server(單體后端)成了垃圾場;主干 CI 三天兩頭掛;跑 GPU 測試就算并行+裁剪依賴,也要 30 分鐘。這些問題并非無解,但在超高速擴張期只會變本加厲。好在內(nèi)部團隊已投入大量精力收拾殘局。
03、Codex 已生成 63 萬 PR,職業(yè)生涯最高光
我在 OpenAI 的最后三個月,幾乎全撲在 Codex 的發(fā)布上。這絕對是我職業(yè)生涯的高光之一。
背景是:2024 年 11 月,OpenAI 把“2025 年發(fā)布一個編程 agent”寫進了 OKR。2 月份,內(nèi)部已有幾個工具把模型用得風(fēng)生水起,我們感到必須盡快推出面向開發(fā)者的 agent——畢竟市面上的 vibe-coding 工具已經(jīng)大爆炸。
我提前結(jié)束產(chǎn)假沖回來參戰(zhàn)。回來后一周,兩支團隊“略顯混亂”地合并,隨即進入 7 周極限沖刺:從第一行代碼到正式發(fā)布,總共 7 周。
這是我近十年最苦的一段日子:大多數(shù)夜晚干到 11、12 點;凌晨 5:30 被新生兒叫醒;7 點又出現(xiàn)在辦公室;周末基本不保。全隊都拼,因為每周都至關(guān)重要——讓我夢回 YC。
這種速度在大公司幾乎不可想象:從 idea 到面向全球、完全免費的產(chǎn)品,只用 7 周。而且功能一點不含糊:我們搭了容器運行時、優(yōu)化倉庫下載、為代碼編輯微調(diào)專用模型、搞定各種 git 操作、造了全新的交互界面、開放網(wǎng)絡(luò)訪問,最終交出體驗相當絲滑的產(chǎn)品。
必須說,OpenAI 依舊保有“發(fā)布基因”。
好消息是:對的人真能創(chuàng)造奇跡。團隊核心配置大概 8 位資深工程師、4 位研究員、2 位設(shè)計師、2 位 GTM 和 1 位 PM。沒有他們,我們早掛了。大家?guī)缀醪挥帽还芾?,但需要大量協(xié)同。如果你有機會和 Codex 團隊任何一個人共事,沖就對了。
發(fā)布前夜,五個人熬到 4 點部署主單體(一次要幾小時),接著 8 點回公司參加直播發(fā)布會。開關(guān)一撥,看著流量瞬間涌入。我從沒見過一個產(chǎn)品只因在左側(cè)導(dǎo)航欄露個臉就能起量——這就是 ChatGPT 的威力。
產(chǎn)品形態(tài)上,我們堅持純異步:不像當時 Cursor 或 Claude Code 那種同步交互,我們希望用戶把 agent 當同事——發(fā)任務(wù)給它,它自己在環(huán)境里跑,最后帶著 PR 回來。
這是一場豪賭:模型現(xiàn)在“夠用”但遠非完美;能連跑幾分鐘,卻跑不了幾小時;用戶信任度天差地別;我們甚至不清楚模型真實能力邊界。
長遠看,我相信大多數(shù)編程最終會像 Codex 這樣。短期就看各家產(chǎn)品如何演進。
Codex(毫不意外)極擅長在超大代碼庫中穿梭。我看到的最大差異化是:可同時起多個任務(wù),再比較結(jié)果。
最近公開數(shù)據(jù)說,Codex 已生成 63 萬 PR,相當于發(fā)布后 53 天里,每位工程師 7.8 萬公開 PR(私有 PR 自己估)。我懷疑這輩子再也碰不到影響力更大的項目了。
04、其他收獲:學(xué)會了在巨型 Python 代碼庫里生存
我第一次真切體會到“超大消費者品牌”長什么樣。做 Codex 時,一切指標都換算成“pro subs”。哪怕面向開發(fā)者的產(chǎn)品,我們也先考慮個人使用場景而非團隊,這把我這個 B2B 背景的人整不會了:開關(guān)一撥,流量當天就到。
我粗淺地見識了大模型是怎么訓(xùn)練的:從“實驗”到“工程”是一條光譜。想法先小規(guī)模實驗,結(jié)果好就塞進更大的訓(xùn)練跑。實驗階段既要調(diào)算法,也要調(diào)數(shù)據(jù)配比,并精細觀察結(jié)果。真正上規(guī)模時,它看起來就像巨型分布式系統(tǒng),各種詭異邊界 case 等你 debug。
我學(xué)會了做 GPU 算數(shù)。Codex 上線前,我們得預(yù)測負載容量。那是我第一次真刀真槍地壓測 GPU。經(jīng)驗是:先把延遲需求(整體延遲、token 總數(shù)、首 token 時間)定死,再反推 GPU 需求;千萬別自下而上算 GPU 理論值。每次模型迭代都可能把負載模式打翻。
我也學(xué)會了在巨型 Python 代碼庫里生存。Segment 是微服務(wù),主力是 Golang + TypeScript,代碼量遠沒這么大。為了支撐上千開發(fā)者并行提交,你得加更多護欄:默認能跑、主干干凈、難以誤用。
05、寫在最后
這篇回顧寫得真誠動人,卻也難掩幾分“精心修飾”的味道:聚焦高光時刻、沖刺節(jié)奏與團隊默契,卻幾乎避開了戰(zhàn)略失誤與體制性障礙。
有人在評論區(qū)這樣說:
“我絕不會在公開場合批評前雇主,這只會傷害自己的職業(yè)前景(說好話反而加分)。據(jù)說 Altman 報復(fù)心強,這對 OpenAI 更是加倍適用。況且他們天天刷社交媒體!”
相比敘事中的熱血與贊美,他提到的技術(shù)細節(jié)反而更值得玩味:代碼風(fēng)格無序、基礎(chǔ)設(shè)施拼貼、內(nèi)部工具五花八門——一家頂級 AI 實驗室,在極速擴張中也無法幸免于“用腳投票”的架構(gòu)演化。
如果你是一名 CTO,愿不愿意加入一家飛速擴張的明星公司,去做一顆“有火花的螺絲釘”?
你會有這樣的勇氣嗎?