美國(guó)七巨頭,OpenAI、Claude、xAI后訓(xùn)練都找他要專家,時(shí)薪高達(dá)500刀!史上增長(zhǎng)最快公司CEO:大模型處于評(píng)測(cè)時(shí)代
原創(chuàng) 精選從 100 萬(wàn)美元到 5 億美元營(yíng)收僅用了 17 個(gè)月!
更厲害的是,他們從未有過(guò)客戶流失,凈收入留存率超過(guò) 1600%,年?duì)I收已經(jīng)穩(wěn)定在九位數(shù)的水平。
而這家公司的CEO兼聯(lián)合創(chuàng)始人,Brendan Foody,更是美國(guó)的新一代的傳奇人物。在 22 歲時(shí),他也成為史上最年輕的美國(guó)獨(dú)角獸創(chuàng)始人。
如果你沒(méi)聽過(guò)這家公司,不打緊,但你要是知道下面這個(gè)信息,相信你肯定會(huì)感興趣:
Mercor 與“七巨頭”中的 6 家,以及所有前五大 AI 實(shí)驗(yàn)室(OpenAI、Anthropic、xAI等)合作,幫助他們招聘專家來(lái)創(chuàng)建評(píng)測(cè)與訓(xùn)練數(shù)據(jù),從而提升模型能力。
沒(méi)錯(cuò),這些頂尖的美國(guó)AI巨頭,全部都從這家公司來(lái)招聘頂尖的后訓(xùn)練專家!
近日,Brendan 做客了 Lenny 的播客訪談,更是透露出大洋彼岸的AI最新進(jìn)展。
在這場(chǎng)對(duì)話中,Brendan 解釋了為什么 evals(評(píng)測(cè))已經(jīng)成為 AI 進(jìn)展的關(guān)鍵瓶頸,他是如何發(fā)現(xiàn)這一巨大機(jī)會(huì)的,以及在 AI 驅(qū)動(dòng)的經(jīng)濟(jì)中未來(lái)的工作可能會(huì)是什么樣子。
在求職招聘方面,Brendan 特別提到:一定要關(guān)注有“需求彈性”的工作,即當(dāng)生產(chǎn)力提高時(shí),需求也會(huì)隨之大幅增加的工作,比如:軟件/設(shè)計(jì)/用戶研究。
所以,從事coding的老鐵們可以放心了,但需要注意的是:現(xiàn)在必須要使用AI來(lái) VibeCoding 了。
此外,對(duì)于如此高增速的公司而言,作為CEO也提到了“996”高強(qiáng)度的工作。 不過(guò)最重要的是,can-do的價(jià)值觀?!靶袆?dòng)比想法重要!”
大模型已經(jīng)進(jìn)入Evals時(shí)代,未來(lái)3年,ASI(超級(jí)智能)為時(shí)尚早!這是他對(duì)美國(guó)硅谷各家頂尖大模型實(shí)驗(yàn)室的洞察。
“實(shí)現(xiàn)這一切的關(guān)鍵不在于‘再多10倍的預(yù)訓(xùn)練數(shù)據(jù)’,而在于更高效、更精心設(shè)計(jì)的后訓(xùn)練數(shù)據(jù)集?!?/span>
以下是整理的對(duì)話全文,原汁原味,各位自行收藏細(xì)讀,enjoy:
主持人:今天的嘉賓是 Mercor 的 CEO 和聯(lián)合創(chuàng)始人 Brendan Foodie。Mercor 是歷史上增長(zhǎng)最快的公司,從零到 5 億美元營(yíng)收只用了 17 個(gè)月,不到一年半。Brendan 也是史上最年輕的獨(dú)角獸創(chuàng)始人。他們剛剛完成了一筆 1 億美元融資,公司估值達(dá)到 20 億美元。如果你還沒(méi)聽說(shuō)過(guò) Mercor,它的業(yè)務(wù)是幫助 AI 實(shí)驗(yàn)室和 AI 公司招聘專家,用 AI 協(xié)助訓(xùn)練他們的模型。他們從未有過(guò)客戶流失,凈收入留存率超過(guò) 1600%,年?duì)I收已經(jīng)穩(wěn)定在九位數(shù)的水平。
在今天的對(duì)話中,我們會(huì)聊到 evals(評(píng)測(cè))的價(jià)值和重要性正在快速上升,像 Mercor 這樣的 AI 訓(xùn)練公司在整個(gè)版圖中的位置,以及它們?yōu)槭裁慈绱酥匾陀袃r(jià)值。我們會(huì)談到 Brendan 是如何發(fā)現(xiàn)這個(gè)機(jī)會(huì)的,他對(duì)產(chǎn)品市場(chǎng)契合的洞見,他在組織內(nèi)部建立的核心原則如何幫助他打造了史上增長(zhǎng)最快的公司。我們還會(huì)討論:為實(shí)驗(yàn)室撰寫 evals 的人每天到底在做什么;在 AI 崛起的浪潮里,哪些技能和崗位能存續(xù)得更久;他為什么認(rèn)為我們短期內(nèi)不會(huì)看到 AGI 或超級(jí)智能;以及更多話題。這期節(jié)目非常精彩,你一定要聽。
主持人:Brendan,非常感謝你今天能來(lái)。歡迎來(lái)到節(jié)目。
Brendan Foody:非常感謝邀請(qǐng)我,Lenny。我是你的超級(jí)粉絲,很期待這次對(duì)話。
主持人:我也很期待,能和你聊聊真是太棒了。我本人也是你的粉絲,希望有更多人了解你和你正在做的事情。
大模型進(jìn)入evals時(shí)代
主持人:我想從你置頂在推特上的一條推文開始。內(nèi)容是:我們現(xiàn)在已經(jīng)與“七巨頭”中的六家合作,和所有前五大 AI 實(shí)驗(yàn)室合作,以及大多數(shù) AI 應(yīng)用層公司。
主持人:有一個(gè)趨勢(shì)在所有客戶身上都很普遍:我們正進(jìn)入 evals 時(shí)代。這讓我特別注意,因?yàn)檫@是這個(gè)播客里反復(fù)被提到的主題。大家都在談 evals 的價(jià)值,以及做好 evals 的重要性。但很多人其實(shí)還不太清楚我們?cè)谡f(shuō)什么,為什么這件事如此關(guān)鍵。你覺(jué)得人們還缺失了什么?他們需要知道哪些東西?evals 時(shí)代意味著什么?
Brendan Foody:如果說(shuō)模型就是產(chǎn)品,那么 evals 就是產(chǎn)品需求文檔(PRD)。研究人員的日常工作就是跑幾十個(gè)實(shí)驗(yàn),在 eval 數(shù)據(jù)集上做一些小的改進(jìn)。
強(qiáng)化學(xué)習(xí)正在變得非常有效。一旦有了 eval,就能幫助模型“攀升”。比如你看奧賽數(shù)學(xué)(Olympiad math),一旦大家集中攻克,很快就飽和了;Sweebench 也是一樣。所以某種意義上,把代理(agents)應(yīng)用到整個(gè)經(jīng)濟(jì)、自動(dòng)化所有工作流的真正瓶頸是:我們?nèi)绾魏饬砍晒??如何?nbsp;eval,如何寫代理要做的一切事情的 PRD?而 Mercor 顯然在這里扮演著核心角色。
如何做好evals?大家更關(guān)心實(shí)際能力
主持人:聽到這,很多人可能會(huì)覺(jué)得,“好吧,我得認(rèn)真關(guān)注 eval 了?!蹦阌惺裁唇ㄗh嗎?比如怎么學(xué)會(huì)做好這件事?那些做得好的公司和其他公司有什么不同?
Brendan Foody:我覺(jué)得對(duì)企業(yè)來(lái)說(shuō),核心思路是:如何建立一個(gè)測(cè)試體系,系統(tǒng)化地衡量 AI 在自動(dòng)化其核心價(jià)值鏈上的效果?比如一家建筑事務(wù)所,最終交付給客戶的是建筑設(shè)計(jì)圖,那他們?cè)趺从行Ш饬?nbsp;AI 在這方面的表現(xiàn)?每家公司都有自己獨(dú)特的價(jià)值鏈,如果是多產(chǎn)品公司可能有幾條。思考如何衡量這些價(jià)值鏈,是企業(yè)有效應(yīng)用 AI 的前提。
主持人:我看到你在 No Priority 播客上和 Sarah、Elad 聊過(guò)這個(gè)話題。Sarah 還發(fā)推說(shuō)“evals = 你的新營(yíng)銷”。這是什么意思?你怎么看?
Brendan Foody:是的,這和我剛才說(shuō)的有聯(lián)系。如果模型是產(chǎn)品,那么 evals 既是 PRD,也是銷售資料。evals 不僅告訴研究人員應(yīng)該構(gòu)建什么,還能向外展示能力的效果。過(guò)去大家都引用學(xué)術(shù)評(píng)測(cè),比如 GPQA、humanities last exam、奧賽數(shù)學(xué)。但現(xiàn)在,大家更關(guān)心實(shí)際能力,比如模型能否自動(dòng)化搭建軟件平臺(tái),能否自動(dòng)化投行分析。我認(rèn)為無(wú)論是實(shí)驗(yàn)室還是應(yīng)用層公司,都將越來(lái)越依賴 evals 來(lái)展示他們的模型和產(chǎn)品能力。
幫大模型公司招聘專家,狂賺4億刀,為什么?
主持人:好,那我們放大一點(diǎn),聊聊你所在市場(chǎng)的格局。我在準(zhǔn)備時(shí)注意到,歷史上增長(zhǎng)最快的公司大概分三類:一類是基礎(chǔ)模型公司;一類是 vibe coding 應(yīng)用(比如 Cursor、Lovable、Bolt、Replit 等 V0 公司);第三類就是數(shù)據(jù)標(biāo)注公司,比如你們。之前我邀請(qǐng)過(guò) Handshake 的 CEO,接下來(lái)會(huì)有 Scale 的 CEO,還有 Surge,再加上你們。能幫我們理清一下這整個(gè)版圖嗎?很多人其實(shí)并不清楚。
Brendan Foody:好的。我先講一點(diǎn)起源故事,來(lái)解釋這個(gè)格局。我們創(chuàng)始團(tuán)隊(duì)在 14 歲時(shí)就認(rèn)識(shí)了,19 歲時(shí)一起創(chuàng)辦公司。最初是在 2023 年 1 月,做國(guó)際招聘,把人匹配給朋友,并自動(dòng)化整個(gè)招聘流程——就像人類會(huì)篩簡(jiǎn)歷、面試、決定錄用一樣,我們用大模型自動(dòng)化了這些環(huán)節(jié)。靠自籌資金做到百萬(wàn)美元營(yíng)收跑速后,我們才退學(xué)創(chuàng)業(yè)。后來(lái)一系列事情發(fā)生了,我們遇到了 OpenAI。
當(dāng)時(shí),人類數(shù)據(jù)市場(chǎng)正經(jīng)歷巨大轉(zhuǎn)變:早期 LLM 需要的是寫一些語(yǔ)法勉強(qiáng)正確句子的低中技能人群。但現(xiàn)在,需求轉(zhuǎn)向了“尋找并驗(yàn)證最優(yōu)秀的專業(yè)人士”,比如資深軟件工程師、投行人士、醫(yī)生、律師,他們能幫助評(píng)估和解讀模型能力。這時(shí)我們就開始和頂級(jí) AI 實(shí)驗(yàn)室合作,在 16 個(gè)月內(nèi)把公司從零做到 4 億美元營(yíng)收跑速。
Brendan Foody:這段旅程非常不可思議,也令人振奮。
主持人:天啊,這太瘋狂了。我不確定大家是否意識(shí)到——我想這是你第一次公開這個(gè)數(shù)字。到我們播出的時(shí)候,你們可能已經(jīng)宣布了:16 個(gè)月從 0 到 4 億美元營(yíng)收。
Brendan Foody:沒(méi)錯(cuò)。這是歷史上最快的增長(zhǎng)記錄,我們對(duì)此非常自豪。
主持人:好吧,說(shuō)明確實(shí)有大事在發(fā)生。這為什么這么有價(jià)值?到底發(fā)生了什么?
主持人:讓我來(lái)簡(jiǎn)單總結(jié)一下你們的業(yè)務(wù):你們幫實(shí)驗(yàn)室招聘人來(lái)訓(xùn)練模型,不只是一般勞動(dòng)力,而是有專業(yè)背景、能解決模型知識(shí)缺口的專家,對(duì)嗎?
Brendan Foody:完全正確。這也回到你最初的問(wèn)題:evals 時(shí)代。實(shí)驗(yàn)室提升模型能力的最大瓶頸就是:如何有效衡量成功?eval 既是他們對(duì)照進(jìn)展的測(cè)試集,也是 RL 環(huán)境里的驗(yàn)證者,用來(lái)獎(jiǎng)勵(lì)模型、提升能力等等。而這種需求存在于所有領(lǐng)域,所有模型還不擅長(zhǎng)的能力上。全球最有錢的公司愿意不惜代價(jià)來(lái)提升模型能力,而 Mercor 就在這個(gè)核心瓶頸上。
專家的日常工作揭秘:給大模型定紅線,監(jiān)督微調(diào)數(shù)據(jù)、強(qiáng)化學(xué)習(xí)任務(wù)
主持人:那么這些專家實(shí)際在做什么?能舉個(gè)例子嗎?比如他們一天到底在電腦前干嘛?
Brendan Foody:市場(chǎng)的邊界就是:凡是人類能做而模型還不能做的,就是需求所在。具體點(diǎn)說(shuō),如果你有一個(gè)模型,要像律師一樣修改合同條款(紅線),但它出錯(cuò)很多,漏掉關(guān)鍵點(diǎn)。你可以請(qǐng)律師像教授設(shè)計(jì)評(píng)分標(biāo)準(zhǔn)一樣,寫一個(gè) rubric(評(píng)分準(zhǔn)則),定義模型該做到哪些點(diǎn),并給出打分方式。這樣我們就能衡量模型進(jìn)步:是否達(dá)到了專業(yè)人士的標(biāo)準(zhǔn)。然后,這些 rubric 還能作為訓(xùn)練數(shù)據(jù),用來(lái)獎(jiǎng)勵(lì)模型、強(qiáng)化其能力。
主持人:所以他們本質(zhì)上就是在寫 eval,對(duì)嗎?
Brendan Foody:沒(méi)錯(cuò)。其實(shí)大家常提 RL 環(huán)境和 evals,但正如 Andrej Karpathy 說(shuō)過(guò)的,它們本質(zhì)上只是不同的語(yǔ)義描述,本質(zhì)上都是“如何衡量好壞”。evals 既能當(dāng)作基準(zhǔn),也能當(dāng)作“銷售資料”,告訴別人“我們的模型為什么最好”,同時(shí)還能用于訓(xùn)練后階段,獎(jiǎng)勵(lì)模型實(shí)現(xiàn)某些能力。
主持人:好,那回到剛才的律師例子。
主持人:律師會(huì)寫出:什么樣的合同修改才算優(yōu)秀,并設(shè)計(jì)一個(gè) rubric 來(lái)定義“優(yōu)秀”。
主持人:那么,他們會(huì)不會(huì)還提供實(shí)際的合同修改示例?
Mercor:可能吧。所以從歷史上看,數(shù)據(jù)格局主要包含兩類數(shù)據(jù)。第一類是監(jiān)督微調(diào)數(shù)據(jù),就是輸入輸出。當(dāng)人們想到傳統(tǒng)意義上的微調(diào)時(shí),說(shuō)的就是這個(gè)。第二類是強(qiáng)化學(xué)習(xí)(RL)任務(wù),模型會(huì)生成幾個(gè)示例,我們選擇哪個(gè)是最優(yōu)的?,F(xiàn)在大家普遍轉(zhuǎn)向的是來(lái)自AI反饋的強(qiáng)化學(xué)習(xí)(RLAIF),而不是人類反饋。在這種方式下,人類定義某種成功標(biāo)準(zhǔn)、某種可衡量的方式。比如在代碼場(chǎng)景里,可能是一個(gè)單元測(cè)試——我們能大規(guī)模衡量成功。在其他領(lǐng)域,可能是一個(gè)評(píng)分標(biāo)準(zhǔn)(rubric)。然后你用這個(gè)來(lái)激勵(lì)模型能力的提升。這種方式更具可擴(kuò)展性,也更高效。所以,這就是為什么整個(gè)市場(chǎng)的大趨勢(shì)正朝著RLAIF發(fā)展,不僅是評(píng)估模型,也是提升模型能力。
主持人:我之前采訪過(guò)Anthropic的一位聯(lián)合創(chuàng)始人,他說(shuō)的完全一樣。他們?cè)贏nthropic所做的,就是轉(zhuǎn)向AI驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)。那我試著用外行人的角度幫觀眾理解:比如,一個(gè)律師會(huì)說(shuō),紅線合同的正確修改應(yīng)該長(zhǎng)什么樣。然后AI就像自己琢磨一樣,“好,我要嘗試改進(jìn)它”,并根據(jù)給定的評(píng)估標(biāo)準(zhǔn)/評(píng)分表來(lái)判斷自己是不是在正確的方向上。
Brendan Foody:沒(méi)錯(cuò)。這就像是應(yīng)用“好結(jié)果”的所有標(biāo)準(zhǔn),類似于助教根據(jù)教授的標(biāo)準(zhǔn)來(lái)判定學(xué)生的回答是否符合某一條或幾條標(biāo)準(zhǔn),然后給多少分。
3年內(nèi)不會(huì)出現(xiàn)超級(jí)智能,因?yàn)榇竽P偷倪吔缇驮谀?/h3>
主持人:太棒了。那我們轉(zhuǎn)向更大的勞動(dòng)市場(chǎng)話題。這問(wèn)題分兩部分:第一部分是,我們需要做這種事情(AI評(píng)估與訓(xùn)練)多久?會(huì)不會(huì)有一天不再需要人類?你們的公司增長(zhǎng)這么快,那會(huì)不會(huì)有個(gè)時(shí)點(diǎn)說(shuō):人類不再需要了,或者已經(jīng)飽和了?我們先聊這個(gè),再進(jìn)入更大的問(wèn)題。
Brendan Foody:關(guān)鍵問(wèn)題是:在經(jīng)濟(jì)中會(huì)有多久存在那些AI做不到但人類能做的事情?
Brendan Foody:當(dāng)然,有些人認(rèn)為三年內(nèi)會(huì)出現(xiàn)超級(jí)智能,那時(shí)人類將不再在經(jīng)濟(jì)中扮演任何角色——這是一個(gè)觀點(diǎn)。但我們的看法完全不同。我們的觀點(diǎn)是,這些模型非常厲害,正在快速自動(dòng)化很多事情,但也有很多它們完全不行的。比如,它仍然不能幫我在日歷上安排會(huì)議,不能幫我寫郵件,不能用一些最基本的工具。我們需要對(duì)一切做評(píng)估——對(duì)工具使用的評(píng)估、對(duì)長(zhǎng)周期推理的評(píng)估。想象一下10年后,我們希望模型能出去運(yùn)行一家創(chuàng)業(yè)公司30天,那就需要對(duì)其進(jìn)行評(píng)估來(lái)有效激勵(lì)它。而且只要在經(jīng)濟(jì)中還存在人類能做但模型做不到的事情,這條改進(jìn)之路就會(huì)一直持續(xù),這也會(huì)成為未來(lái)工作的重要組成部分。所以我們的使命就是創(chuàng)造未來(lái)的工作形態(tài)。我認(rèn)為這個(gè)行業(yè)非常令人興奮,因?yàn)樗鼮槲覀冋故玖宋磥?lái)發(fā)展的大方向。
未來(lái)求職:關(guān)注有需求彈性的崗位,軟件、設(shè)計(jì)、用戶研究這些崗位只會(huì)增加
主持人:我想問(wèn)你轉(zhuǎn)發(fā)過(guò)的一條推文。“如果你仔細(xì)想想,我們來(lái)到這個(gè)世界的意義就是為實(shí)驗(yàn)室創(chuàng)造強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)?!蹦阍趺纯矗窟@句話意味著什么?是不是說(shuō)我們其實(shí)就是在幫模型訓(xùn)練?
Brendan Foody:這句話對(duì)應(yīng)了我和很多頂尖實(shí)驗(yàn)室研究人員和高管的對(duì)話。他們認(rèn)為整個(gè)經(jīng)濟(jì)高度可能會(huì)演變成一個(gè)RL環(huán)境機(jī)器。我們會(huì)構(gòu)建各種各樣的世界和場(chǎng)景,然后在其中加入評(píng)分標(biāo)準(zhǔn)或其他驗(yàn)證機(jī)制。這其實(shí)非常令人興奮。類比到歷史上的其他革命,比如工業(yè)革命時(shí),大家都擔(dān)心失業(yè),但隨之出現(xiàn)了一整類新工作:如何造機(jī)器、如何進(jìn)行知識(shí)工作、如何創(chuàng)造新的事物。過(guò)去三年的AI敘事幾乎全是關(guān)于“工作被取代”。當(dāng)然,ChatGPT發(fā)展很快,大家都喜歡用它。但從經(jīng)濟(jì)層面上,討論的更多是取代,很少有公司和人去討論新工作類別正在被創(chuàng)造,以及這意味著什么,人們?nèi)绾螠?zhǔn)備和提升自己。對(duì)我來(lái)說(shuō),最令人興奮的就是:創(chuàng)造那個(gè)未來(lái)——人類如何融入經(jīng)濟(jì),并且這一過(guò)程如何演變。
主持人:我經(jīng)常遇到有人問(wèn)我:我該學(xué)什么?我該提升哪些能力?正在讀書的人也會(huì)問(wèn):未來(lái)到底什么才是有價(jià)值的?而你正處在人才需求的中心,你最清楚哪些崗位最受歡迎,招聘如何演變。我想直接問(wèn)你:未來(lái)哪些崗位會(huì)保留?年輕人應(yīng)該投資哪些技能?
Brendan Foody:關(guān)于崗位,我會(huì)從需求彈性很大的類別來(lái)回答。這些會(huì)非常令人興奮。比如,當(dāng)一個(gè)人生產(chǎn)力提高10倍時(shí),我們就能開發(fā)10倍、甚至100倍的軟件。產(chǎn)品經(jīng)理在這種情況下就會(huì)非常有優(yōu)勢(shì)。至于技能,我認(rèn)為關(guān)鍵是能利用AI完成自己日常工作的人。比如,我和一些老師聊過(guò),他們想知道如何更好地評(píng)估學(xué)生。我們最早做過(guò)大量AI面試和評(píng)估,對(duì)此很有經(jīng)驗(yàn)。我們的結(jié)論是:你不應(yīng)該阻止學(xué)生用模型,就像計(jì)算器出現(xiàn)后,你不可能還讓學(xué)生天天做算術(shù)作業(yè)。你應(yīng)該告訴他們:“去用這些工具,讓我們看看你能做到什么?!彼栽谖覀兊拿嬖?yán)?,我們?huì)說(shuō):“去用ChatGPT、Codex、ClaudeCode、Cursor等任何工具,在一個(gè)小時(shí)內(nèi)搭建一個(gè)網(wǎng)站?!蔽覀兿肟纯醋罱K你能產(chǎn)出什么產(chǎn)品。這個(gè)例子其實(shí)就說(shuō)明了技能方向:關(guān)鍵不是對(duì)抗AI,而是如何借助它在自己所在行業(yè)做得更多。
主持人:你說(shuō)的“需求彈性”,是指通才型人才嗎?
Brendan Foody:不是,我指的是行業(yè)的需求容量。舉幾個(gè)例子:會(huì)計(jì)——全世界需要的會(huì)計(jì)數(shù)量是有限的,不太可能需要100倍的會(huì)計(jì)。但軟件開發(fā)不一樣。我們完全可以交付100倍的功能,迭代速度快100倍,構(gòu)建更多新東西。這里的需求幾乎無(wú)限。最近Marc(注:指硅谷投資人Marc Andreessen)也在推特上說(shuō)過(guò):軟件是最具彈性的行業(yè)。當(dāng)生產(chǎn)力提高時(shí),需求也會(huì)隨之大幅增加。這種特征在很多其他行業(yè)也存在。所以我會(huì)建議人們關(guān)注那些:當(dāng)大家的生產(chǎn)力提升10倍,需求會(huì)隨之增加,而不是減少的領(lǐng)域。
主持人:所以你的觀點(diǎn)是“學(xué)習(xí)編程依然有用”。計(jì)算機(jī)科學(xué)還是值得學(xué)的。那么在彈性崗位類別里,工程和產(chǎn)品管理肯定在內(nèi)。還有哪些?比如設(shè)計(jì)、用戶研究?
Brendan Foody:是的,還有很多環(huán)節(jié),整個(gè)公司構(gòu)建的價(jià)值鏈里都有這樣的變量。比如運(yùn)營(yíng)、咨詢。想象一下如果我們能有10倍的麥肯錫咨詢顧問(wèn),會(huì)產(chǎn)生多少研究和分析?但我認(rèn)為能成功的公司和個(gè)人,都是那些擁抱豐裕思維的人,思考“如何做得更多”,而不是抵抗“如何避免被替代”。
主持人:說(shuō)到這里,就讓我想起你提到的第二類成功者——不是具體技能,而是會(huì)用AI,讓自己更強(qiáng)的人。這讓我想到馬斯克和Neuralink,他說(shuō)未來(lái)AGI或超級(jí)智能出現(xiàn)時(shí),人類要想競(jìng)爭(zhēng),最好的辦法就是把大腦接入超級(jí)智能。這有點(diǎn)像現(xiàn)在的AI:熟練使用AI工具的人,其實(shí)就像獲得了超級(jí)能力。
Brendan Foody:沒(méi)錯(cuò),能學(xué)會(huì)如何利用并融入AI,將會(huì)至關(guān)重要。
主持人:對(duì),這其實(shí)就回到一句現(xiàn)在聽起來(lái)有點(diǎn)老套的話:AI不會(huì)取代你,會(huì)用AI的人會(huì)取代你。
Brendan Foody:我完全同意。在企業(yè)級(jí)別上我也確實(shí)看到了這種情況。有些公司害怕接觸,不想評(píng)估,因?yàn)橐坏┰u(píng)估就等于承認(rèn)價(jià)值鏈正在被自動(dòng)化。但也有一些公司——一些最知名、最復(fù)雜的財(cái)富500企業(yè)——正積極擁抱這種思維:如果我們能多做10倍、100倍,會(huì)意味著什么?未來(lái)10年會(huì)有那么多改變,而這些公司將會(huì)是最成功的。
未來(lái)招聘市場(chǎng)走向:AI修改簡(jiǎn)歷泛濫,需要智能篩選機(jī)制
主持人:我們?cè)倭幕貏趧?dòng)市場(chǎng)。你們公司最初并不是要把人送去AI實(shí)驗(yàn)室,不是為了訓(xùn)練模型,而是幫助人找工作、幫助公司招聘。后來(lái)才發(fā)現(xiàn)了這個(gè)巨大的機(jī)會(huì)。所以你們對(duì)未來(lái)勞動(dòng)市場(chǎng)和招聘的走向有很獨(dú)特的看法,能談?wù)剢幔?/span>
Brendan Foody:是的。我還記得我們剛創(chuàng)業(yè)時(shí)(當(dāng)時(shí)我19歲),只是有個(gè)直覺(jué):勞動(dòng)力市場(chǎng)過(guò)于低效和分散。什么意思呢?比如我們要在全球招聘,候選人會(huì)申請(qǐng)十幾份工作。但作為一家灣區(qū)公司,我們只會(huì)考慮市場(chǎng)上極小一部分候選人。原因是匹配問(wèn)題必須人工解決:人工篩簡(jiǎn)歷、人工面試、人工決定雇誰(shuí)。但如果這個(gè)匹配問(wèn)題能用軟件自動(dòng)化解決,就能形成一個(gè)全球統(tǒng)一的勞動(dòng)市場(chǎng)——所有候選人都申請(qǐng)到同一個(gè)市場(chǎng),所有公司都從同一個(gè)市場(chǎng)招聘,信息流動(dòng)更加順暢。毫無(wú)疑問(wèn),這就是未來(lái)的方向。但我們后來(lái)意識(shí)到,工作的本質(zhì)也在劇烈變化。而在未來(lái)10年的建設(shè)中,除了打造市場(chǎng),我們還需要通過(guò)評(píng)估和RL環(huán)境數(shù)據(jù)集為客戶創(chuàng)造未來(lái)的工作形態(tài)。
主持人:我看到的招聘趨勢(shì)也印證了這一點(diǎn)。我跟合作伙伴Gnome一起做過(guò)研究:現(xiàn)在投簡(jiǎn)歷變得太容易了,大家都能用AI快速改簡(jiǎn)歷、寫求職信,一口氣投幾百家公司。招聘經(jīng)理這邊就被簡(jiǎn)歷海淹沒(méi)了,所以不得不依賴AI來(lái)篩選。即使我們不想走到這一步,也被推著走:申請(qǐng)量和招聘量的暴增,迫使我們必須有更智能的過(guò)濾和選擇機(jī)制。這正是你們這些年來(lái)一直在構(gòu)建的。
Brendan Foody:沒(méi)錯(cuò)。很多人會(huì)問(wèn):我們到底是勞動(dòng)市場(chǎng)公司,還是數(shù)據(jù)公司?這個(gè)問(wèn)題有意思,因?yàn)槲覀円庾R(shí)到實(shí)驗(yàn)室真正需要的其實(shí)是勞動(dòng)市場(chǎng)。他們需要的是那些頂尖的專業(yè)人才。當(dāng)然我們會(huì)附加一些項(xiàng)目管理和軟件平臺(tái),但核心是:如何找到這些跨領(lǐng)域的高水平專家,來(lái)測(cè)評(píng)模型能力,并共同構(gòu)建未來(lái)的工作形態(tài)。
人的質(zhì)量,決定ChatGPT的質(zhì)量
主持人:回到你們的業(yè)務(wù)。我和朋友聊過(guò)一件事:他腳踝扭傷,拍了X光片,然后把片子扔給ChatGPT,讓它分析。結(jié)果它真的給出診斷了。他就問(wèn)我:“這模型是怎么知道的?網(wǎng)上哪里有這樣的訓(xùn)練數(shù)據(jù)?”我告訴他,不是這樣,其實(shí)是有人在幫模型理解——當(dāng)它不會(huì)時(shí),人類會(huì)教它。所以模型的學(xué)習(xí)背后,是人類在不斷提供幫助。
Brendan Foody:沒(méi)錯(cuò)。其實(shí)運(yùn)作的方式,至少大多數(shù)人的理解是這樣的:模型的工作原理很復(fù)雜,預(yù)訓(xùn)練把大量知識(shí)灌進(jìn)模型里,相當(dāng)于讓它見過(guò)世界上各種事物。然后后訓(xùn)練和強(qiáng)化學(xué)習(xí),才是幫助模型區(qū)分哪些知識(shí)是準(zhǔn)確的、哪些是不準(zhǔn)確的,以及在特定時(shí)刻該如何優(yōu)先取舍來(lái)做出決定。在這背后,其實(shí)就有放射科醫(yī)生參與后訓(xùn)練數(shù)據(jù)集的標(biāo)注,他們會(huì)設(shè)定一個(gè)參考點(diǎn)——比如診斷結(jié)果,并配上相應(yīng)的獎(jiǎng)勵(lì)或懲罰機(jī)制。
Brendan Foody:最終,正是這些人的質(zhì)量,決定了 ChatGPT 的決策和推薦的質(zhì)量。
主持人:那我們繼續(xù)展開一下,因?yàn)檫@真的很有意思,我覺(jué)得沒(méi)多少人真正理解。我大概能理解。所以你們和這些專家做的工作,其實(shí)是“后訓(xùn)練”。這不是往模型預(yù)訓(xùn)練階段去喂數(shù)據(jù),而是說(shuō):我們已經(jīng)有了 GPT-5 模型,然后要補(bǔ)上它缺失的東西,再加強(qiáng)它。對(duì)吧?
Brendan Foody:對(duì)。更準(zhǔn)確地說(shuō),這是幫助模型從預(yù)訓(xùn)練里篩選正確的 token,強(qiáng)化正確的推理鏈,讓模型能更通用、更好地推理。
主持人:有多少人規(guī)模在做這件事?是幾千、幾萬(wàn)人,還是幾十萬(wàn)人?
Brendan Foody:通常是幾萬(wàn)人同時(shí)在做,更廣泛來(lái)說(shuō)是幾十萬(wàn)人。規(guī)模非常大。而且最令人興奮的是它增長(zhǎng)得非??臁D銊偛盘岬礁?jìng)爭(zhēng)格局——過(guò)去主要是一些眾包公司雇傭大量低技能勞動(dòng)力,比如 Scale 和 Surge 這類公司算是行業(yè)的先驅(qū)。但現(xiàn)在過(guò)渡到高技能勞動(dòng)后,人們發(fā)現(xiàn)只要找到更高水平的人才,即便數(shù)量少一些,價(jià)值也能遠(yuǎn)遠(yuǎn)更大。等到滿足質(zhì)量標(biāo)準(zhǔn)后,再逐步放大規(guī)模。我們的快速增長(zhǎng)和營(yíng)收成功,也吸引了一批后來(lái)者追隨這個(gè)市場(chǎng)邏輯,這是合理的。
主持人:挺有意思。
主持人:其實(shí)一直有一些公司,比如 AlphaSites 和 GLG,在 AI 之前就做過(guò)類似的事:花錢把人和專家連線,問(wèn)他們問(wèn)題?,F(xiàn)在事實(shí)證明這對(duì)模型也很有用,只不過(guò)不再需要“中間人”。
Brendan Foody:沒(méi)錯(cuò)。
Brendan Foody:但核心區(qū)別在于:AlphaSites 通常只是“一次性電話咨詢”,而我們更多是把人招進(jìn)來(lái)做項(xiàng)目,需要他們長(zhǎng)期投入。這也是為什么傳統(tǒng)專家網(wǎng)絡(luò)很難切入這一領(lǐng)域。另外,你還要考慮怎么長(zhǎng)期留住這些人,以及建立起合理的激勵(lì)機(jī)制。某種程度上,它更像 Uber 或 DoorDash 這樣的勞動(dòng)市場(chǎng),只不過(guò)我們對(duì)接的是高技能人才,并且給予非常優(yōu)厚的待遇。
主持人:我今天學(xué)到好多東西,所以我想多問(wèn)幾個(gè)問(wèn)題。你們找的專家,到底是更多偏“硬知識(shí)”,還是偏“人格和軟技能”?比如具體到:怎么做檢查,怎么做 X 光?
Brendan Foody:要看不同實(shí)驗(yàn)室的需求,兩者都有。以前可能更偏軟技能,但現(xiàn)在很多實(shí)驗(yàn)室聚焦的是商業(yè)模式:哪些能力能直接帶來(lái)收入,所以更傾向于專業(yè)領(lǐng)域的硬技能。不過(guò)創(chuàng)意類能力同樣很重要。比如幾個(gè)月前我們就把哈佛 Lampoon 喜劇社整隊(duì)招了進(jìn)來(lái),讓模型變得更幽默。我們也會(huì)請(qǐng)艾美獎(jiǎng)編劇,或者各類創(chuàng)意人才,來(lái)提升模型的創(chuàng)造力。
24小時(shí)內(nèi)交付專家,只需留住前10%的人,時(shí)薪最高達(dá)500美刀
主持人:這故事太酷了。我迫不及待想看到效果。這種改進(jìn)見效要多久?幾個(gè)月還是幾年?
Brendan Foody:要看實(shí)驗(yàn)室。有些模型會(huì)迭代式更新,幾周就悄悄改進(jìn)一次;有些則會(huì)搞“大版本發(fā)布”。我們?cè)谒羞@些實(shí)驗(yàn)室背后提供支持。我們動(dòng)作很快,比如客戶說(shuō)要找獲獎(jiǎng)編劇,我們能在 24 小時(shí)內(nèi)交付專家。還有個(gè)很有趣的現(xiàn)象:我們雇的 100 個(gè)人里,往往前 10% 的人貢獻(xiàn)了大部分改進(jìn)。就像一家公司,10% 的頂尖員工決定了大部分產(chǎn)出。這意味著只要我們能識(shí)別并留住那前 10% 的人,再把他們高效匹配到項(xiàng)目里,就能創(chuàng)造巨大的客戶價(jià)值,也形成了競(jìng)爭(zhēng)壁壘。這正是公司最初的核心邏輯:找到卓越人才,并持續(xù)把他們帶給客戶。
主持人:那具體來(lái)說(shuō),比如你們招了一個(gè)叫 Jane 的人,她很會(huì)寫代碼,她會(huì)不會(huì)就被 Anthropic 全職雇走?還是說(shuō)主要是兼職、項(xiàng)目制?
Brendan Foody:都有。有時(shí)是全職,但多數(shù)是兼職。比如有些人在大廠工作,節(jié)奏慢,手里還有 20 小時(shí)富余時(shí)間,就會(huì)來(lái)做這類任務(wù)。當(dāng)然我們也提供很多 40 小時(shí)全職崗位。
主持人:那收入呢?對(duì) FAANG 工程師來(lái)說(shuō)值得嗎?
Brendan Foody:非常值得。我們平臺(tái)的中位時(shí)薪是 95 美元,最高可以到 500 美元/小時(shí),取決于專業(yè)深度。對(duì)比傳統(tǒng)眾包平臺(tái),他們一般平均只付 30 美元/小時(shí),所以只能雇些本科生。而我們能吸引到高盛銀行家、麥肯錫顧問(wèn)、FAANG 工程師。最終還是要看實(shí)驗(yàn)室需要的能力,大多數(shù)需求還是落在后者這些高技能人群身上。
Claude代碼為什么領(lǐng)先?評(píng)測(cè)!
主持人:我知道你不能說(shuō)太多客戶細(xì)節(jié),但比如 Anthropic Claude 在寫代碼方面一直領(lǐng)先于其他模型,還能寫得很好。我也用它做寫作反饋。為什么他們能這么強(qiáng)?
Brendan Foody:我不能講太細(xì)。但整體趨勢(shì)就是:強(qiáng)化學(xué)習(xí),以及認(rèn)真定義正確的獎(jiǎng)勵(lì)機(jī)制,避免獎(jiǎng)勵(lì)黑客化,才讓模型越來(lái)越好。這就是評(píng)測(cè)的威力??蛻艚?jīng)常說(shuō):“模型的好壞取決于它的評(píng)測(cè)?!边@句話一直成立。
主持人:我記得 Greg Brockman 發(fā)過(guò)一句話:“Evals are all you need?!贝_實(shí)如此。
抓住史上最大商機(jī):領(lǐng)先指標(biāo)、客戶至上,強(qiáng)推PMF無(wú)意義
主持人:我們聊回Mercor 本身吧。你們可能是歷史上增長(zhǎng)最快的公司了。
我想了解你們是怎么做到的。你認(rèn)為 Mercor 成功的核心要素是什么?
Brendan Foody:最重要的是抓住快速變化市場(chǎng)里的領(lǐng)先指標(biāo)。以前在風(fēng)投圈,大家總說(shuō)“為什么是現(xiàn)在(Why Now)”。我一開始理解為產(chǎn)品層面的時(shí)機(jī),比如現(xiàn)在能自動(dòng)化篩簡(jiǎn)歷、做面試。但其實(shí)關(guān)鍵在于市場(chǎng)。你要找到那些變化飛快的新市場(chǎng)和新需求點(diǎn)——世界上最有錢的客戶愿意為提升模型能力花任何代價(jià)。我們就要盯住這些領(lǐng)先信號(hào),把一切資源優(yōu)化到為頭部客戶提供最好的解決方案上。這是最有影響力的一點(diǎn)。
另一個(gè)核心是客戶至上。在公司成立一年半里,我們沒(méi)有銷售團(tuán)隊(duì),也沒(méi)有市場(chǎng)團(tuán)隊(duì),100% 的資源都放在打磨產(chǎn)品和體驗(yàn)??靠诒畟鞑?,客戶在別的公司工作時(shí)還想繼續(xù)用我們。這就是我們花所有時(shí)間的地方。很多創(chuàng)業(yè)者容易過(guò)早糾結(jié)“怎么做好市場(chǎng)推廣”,但真正重要的是:先把讓客戶愛(ài)上的“六星體驗(yàn)”做到。
主持人:我想回到你剛才說(shuō)的,你們發(fā)現(xiàn)了一個(gè)可能是“史上最大商機(jī)”的口袋市場(chǎng)。你們是怎么第一次意識(shí)到的?
Brendan Foody:這背后有些瘋狂的故事。我們?cè)?nbsp;2023 年 1 月成立公司,到 2023 年 8 月,我還在上大學(xué)。有客戶把我們介紹給 xAI 的聯(lián)合創(chuàng)始人,說(shuō)我們有一批數(shù)學(xué)和編程很強(qiáng)的印度工程師。我們見面后強(qiáng)調(diào)他們的強(qiáng)項(xiàng)就是因?yàn)椴挥帽蝗宋膶W(xué)科分心,不用學(xué)歷史英語(yǔ)這些,他們很喜歡。兩天后,xAI 就請(qǐng)我們?nèi)?nbsp;Tesla 辦公室,見了整個(gè)聯(lián)合創(chuàng)始團(tuán)隊(duì)(除了 Elon)。當(dāng)時(shí) xAI 剛成立,他們對(duì)我們“專家質(zhì)量?jī)?yōu)先”的理念非常興奮。雖然他們那時(shí)還在做預(yù)訓(xùn)練,不急著要人類數(shù)據(jù),所以沒(méi)有立刻合作,但我們已經(jīng)意識(shí)到市場(chǎng)會(huì)徹底變革,我們必須走在前沿。
再往后幾個(gè)月,一家眾包公司來(lái)用我們的平臺(tái)雇了上千人。結(jié)果我們收到大量工單,投訴他們沒(méi)拿到錢。我們很愧疚,因?yàn)槲覀兺扑]的機(jī)會(huì)竟然沒(méi)兌現(xiàn)。這讓我們意識(shí)到:很多老牌公司在人才體驗(yàn)上完全停滯,人才被當(dāng)作廉價(jià)消耗品。但其實(shí)可以直接和實(shí)驗(yàn)室合作,既保證專家尊嚴(yán)、又支付高薪,同時(shí)切掉中間環(huán)節(jié)。于是我們?cè)?/span>2024 年 5 月開始直接對(duì)接實(shí)驗(yàn)室,后面的故事你就知道了。
主持人:哇。
主持人:這就帶來(lái)了上億美元的營(yíng)收。所以總結(jié)一下,你們的思路是:先敏銳捕捉“需求拉力”,然后一旦確認(rèn)市場(chǎng)有意義,就全力把客戶體驗(yàn)做到極致。
Brendan Foody:對(duì)。如果給創(chuàng)業(yè)者一句建議,就是:別老想著“強(qiáng)推產(chǎn)品市場(chǎng)匹配”。當(dāng)然,你需要堅(jiān)持自己的世界觀,認(rèn)為世界會(huì)如何變化,但有時(shí)市場(chǎng)本身會(huì)告訴你“拉力”在哪。要找到那些非常容易成交的客戶,因?yàn)槟谴硭麄兺袋c(diǎn)極大、需求迫切。如果每個(gè)客戶都得拼命去推銷,那業(yè)務(wù)做不大。你需要找到“輕而易舉就能成交的客戶”,那才是增長(zhǎng)的核心。所以既要對(duì)未來(lái)的假設(shè)保持執(zhí)著,又要對(duì)市場(chǎng)的具體走向保持開放,隨時(shí)調(diào)整。
主持人:這真是一個(gè)了不起的洞見。
主持人:在你剛剛描述的那些時(shí)刻里,感覺(jué)像是兩個(gè)關(guān)鍵點(diǎn)疊加在一起:一個(gè)是和 xAI 的會(huì)面——你們意識(shí)到,“哇,他們真的、真的很想要我們手上這點(diǎn)東西,雖然我們做得還不夠完美”;另一個(gè)就是平臺(tái)上一千人的大規(guī)模招聘。
主持人:是不是就是這兩個(gè)瞬間讓你們覺(jué)得:“對(duì),就是這樣”?
Brendan Foody:沒(méi)錯(cuò)。而且要注意,這些事發(fā)生的時(shí)候,我們還只是一個(gè)種子輪階段的公司。第一個(gè)是在我們拿到任何種子輪融資之前,當(dāng)時(shí)完全是自力更生。我們把公司做到了一百萬(wàn)美元的收入運(yùn)行率,始終保持極高的資本效率,從沒(méi)燒過(guò)錢,整體上一直是盈利的。然后我們?cè)?nbsp;9 月份拿到了 General Catalyst 的種子輪投資。第二個(gè)經(jīng)驗(yàn),就是在那之后我們真正看清了這個(gè)市場(chǎng)存在巨大的需求——我們看到了量,看到了老玩家其實(shí)對(duì)市場(chǎng)的變化和所需人才有點(diǎn)“睡過(guò)去”了。
老外也在996,持續(xù)成功的三個(gè)價(jià)值觀:can-do、高標(biāo)準(zhǔn)、強(qiáng)度
主持人:看到機(jī)會(huì)并開始執(zhí)行是一回事,但能在這樣的規(guī)模下持續(xù)成功是另一回事。你們公司內(nèi)部有一些非常具體的價(jià)值觀,請(qǐng)談?wù)勥@些。我感覺(jué)這也是你們成功的重要原因。
Brendan Foody:確實(shí)如此。我可以分享三個(gè)核心價(jià)值觀,并且每個(gè)都講個(gè)小故事。
第一個(gè)是“能做的態(tài)度(can-do attitude)”。大家總是拿這個(gè)說(shuō)笑,但我們真的一直在設(shè)定看起來(lái)瘋狂的目標(biāo),然后公司的軌跡竟然真的圍繞著這些目標(biāo)展開。我記得在 Benchmark 帶領(lǐng)我們 A 輪融資之前,我們當(dāng)時(shí)收入運(yùn)行率是 150 萬(wàn)美元,我說(shuō)我們年底會(huì)做到 5000 萬(wàn),他們覺(jué)得我們瘋了。結(jié)果前后兩周的差距,我們真的做到了。而且今年我們?cè)缇瓦h(yuǎn)遠(yuǎn)超過(guò)了最初定的 5 億美元運(yùn)行率目標(biāo)。所以,不管是營(yíng)收規(guī)模還是人才體驗(yàn),我們都會(huì)設(shè)定極度雄心勃勃的目標(biāo),而“能做的態(tài)度”是第一條。
第二個(gè)是高標(biāo)準(zhǔn)。不管是招聘還是日常期望,我們的門檻都非常高。我們雇了很多前創(chuàng)業(yè)者,背景非常優(yōu)秀的人才。比如我們剛剛請(qǐng)來(lái) Sandeep Jain 擔(dān)任總裁,他之前是 Uber 的首席產(chǎn)品官和首席技術(shù)官。Uber 當(dāng)然是全球最大的勞動(dòng)市場(chǎng),而他愿意加入我們這種相對(duì)還小的公司,就是為了幫我們把流程規(guī)?;?。
第三個(gè)是強(qiáng)度(intensity)??纯?nbsp;Meta 或 Google 的早期文化,都有那種極度強(qiáng)烈的“推山移?!钡膭蓬^。我們公司也是這種氛圍——注重輸出結(jié)果,而不是考核你具體坐多少小時(shí)。但大家都清楚,要建立一家傳奇公司,就必須投入巨大的強(qiáng)度。
主持人:我能理解為什么這套能行。
“能做的態(tài)度 + 高標(biāo)準(zhǔn) + 強(qiáng)度”,聽起來(lái)就是成功組合?,F(xiàn)在外界很多討論 996、699 這種文化(每天 早9 點(diǎn)到晚 9 點(diǎn),每周 6 天)。很多人覺(jué)得這很糟糕,為什么要這樣壓榨員工?但與此同時(shí),我不斷聽到頂級(jí) AI 公司都在說(shuō),這是成功的必然。機(jī)會(huì)太難得,速度太快,錯(cuò)過(guò)就沒(méi)了。你怎么看?
Brendan Foody:我需要澄清一點(diǎn):我們從來(lái)沒(méi)有強(qiáng)制規(guī)定工時(shí)。這更多是自然而然的結(jié)果——大家都很在乎公司的發(fā)展軌跡。很多人會(huì)自愿留下來(lái)加班,但如果他們要早點(diǎn)走去陪孩子吃飯,或者周末要出行,那完全沒(méi)問(wèn)題。對(duì)我們來(lái)說(shuō),關(guān)鍵在于找到那些有強(qiáng)烈主人翁意識(shí)、真正認(rèn)同公司使命的人,而不是盯著他們坐在辦公室多少小時(shí)。只是現(xiàn)實(shí)往往是——最認(rèn)同的人,通常也就是那些愿意和我們一起熬夜的人。
主持人:當(dāng)你說(shuō)“高標(biāo)準(zhǔn)”的時(shí)候,有沒(méi)有什么具體的例子可以說(shuō)明你們的要求到底有多高?
很多人覺(jué)得自己有高標(biāo)準(zhǔn),但其實(shí)并沒(méi)有。
Brendan Foody:如果你足夠耐心,就能在招聘中把質(zhì)量和速度之間的權(quán)衡做好。我記得我們前 10 個(gè)員工的招聘過(guò)程,就異常耐心和嚴(yán)格。比如我們?cè)诿绹?guó)的第二個(gè)員工 Sid,之前是 Scale 的增長(zhǎng)主管,他加入我們的時(shí)候我們還只是種子公司。還有 Daniel,他曾經(jīng)把兩個(gè)消費(fèi)級(jí)應(yīng)用做到 10 萬(wàn)以上用戶。這些人背景都非常不凡。最初那 10 個(gè)員工的“人才密度”,極大地塑造了公司后續(xù)擴(kuò)張時(shí)的文化和格局。
招人的快與慢
主持人:我知道你們還有個(gè)觀點(diǎn)是:外界經(jīng)常說(shuō)“招人要慢”,但你認(rèn)為這并不總是對(duì)的。能展開講講嗎?
Brendan Foody:這確實(shí)是把雙刃劍。一方面,我很高興我們前 10 個(gè)員工都如此優(yōu)秀,這對(duì)公司幫助巨大。但另一方面,公司到了一定規(guī)模,就必須快速招聘。有些工作就是需要大量人力來(lái)完成。你必須承認(rèn),快速招聘一定會(huì)帶來(lái)一定差異性,但此時(shí)速度更重要。某種意義上,我們?cè)趫F(tuán)隊(duì)擴(kuò)張上其實(shí)走得有點(diǎn)慢了。好處是每個(gè)人都很強(qiáng),我們保持了高門檻。但壞處就是,即使公司已經(jīng)成長(zhǎng)得很快了,其實(shí)我們本可以更快,如果我們?cè)趶?nbsp;10 人擴(kuò)張到 100 人這段時(shí)間里能更迅速些。
主持人:所以前 10 人要謹(jǐn)慎,之后 10 到 100 人要加快?
Brendan Foody:差不多吧,但我不會(huì)說(shuō)一定是“10”這個(gè)數(shù)字。關(guān)鍵點(diǎn)是:一旦你清楚公司真的跑通了,市場(chǎng)需求遠(yuǎn)超你能承接的范圍,那就是要“踩油門”的時(shí)候,速度比什么都重要。但在此之前,耐心和高標(biāo)準(zhǔn)依然最重要。
高速增長(zhǎng)下CEO的兩件事
主持人:你之前還創(chuàng)過(guò)幾家公司,規(guī)模都比較小。現(xiàn)在作為一家超高速增長(zhǎng)公司 CEO,最讓你意外的是什么?很多人夢(mèng)想當(dāng) CEO,但可能想象不到日常的重點(diǎn)。
Brendan Foody:其實(shí)沒(méi)什么太意外的。最主要的兩個(gè)方面依然是招聘和客戶。第一是怎么找到、培養(yǎng)最強(qiáng)的團(tuán)隊(duì);第二是怎么真正理解客戶需要什么,以及我們?nèi)绾沃С炙麄?。?dāng)然,還有很多臨時(shí)出現(xiàn)的管理事務(wù),比如組織架構(gòu)、薪酬等級(jí)等等,這是隨著公司規(guī)?;艜?huì)遇到的。但核心時(shí)間花在招聘和客戶上,這和我之前的預(yù)期一致,也正好是我最喜歡做的事,這算是幸運(yùn)吧。
從甜甜圈到AWS項(xiàng)目:行動(dòng)比想法更重要
主持人:你過(guò)去創(chuàng)的那兩家公司,能分享一下嗎?我覺(jué)得挺有趣。它們又是如何幫助你在現(xiàn)在的角色里更成功的?
Brendan Foody:我之前搞過(guò)十幾個(gè)項(xiàng)目,挑兩個(gè)最喜歡的吧。一個(gè)是我八年級(jí)時(shí)開的 甜甜圈王國(guó)(Donut Dynasty)。當(dāng)時(shí)發(fā)現(xiàn) Safeway 賣一打甜甜圈才 5 美元,我覺(jué)得太劃算了。于是我騎車去買,再拿回學(xué)校,一個(gè)賣 2 美元。賣得飛快。我后來(lái)請(qǐng)我媽開車送我去批量進(jìn)貨,一次買十打帶回來(lái)賣。后來(lái)學(xué)校禁止我在校園賣食物,我就把攤子挪到校門口 50 英尺之外,說(shuō)他們沒(méi)權(quán)力管我。競(jìng)爭(zhēng)對(duì)手也出現(xiàn)了,有人賣更高檔的 Chuck’s Donuts,一只就要 1 美元。我于是把價(jià)格壓到 1 美元兩個(gè),撐了兩周把他們擠出市場(chǎng)(當(dāng)時(shí)我還不知道這叫反競(jìng)爭(zhēng))。我還雇朋友幫賣,用甜甜圈支付他們的勞務(wù),他們覺(jué)得值 2 美元一只。就是各種有趣的商業(yè)博弈。
另一個(gè)是我高中時(shí)期做的 AWS 相關(guān)業(yè)務(wù),規(guī)模更大一些。但我從這些經(jīng)歷里得到的最大收獲就是:行動(dòng)比想法更重要。很多人都有點(diǎn)子,但很少人真正去做。只要你愿意開始做、去滿足客戶需求,并投入精力和野心,就能把事情做起來(lái)。這些練習(xí)讓我明白,后來(lái)應(yīng)該在更大規(guī)模上干同樣的事。
主持人:哈哈,這個(gè)故事太棒了。
主持人:我最喜歡的是你給你媽 20 美元當(dāng)“運(yùn)費(fèi)”。
Brendan Foody:對(duì),她堅(jiān)持說(shuō)這不是白幫忙,得算她的時(shí)間成本。她還要求給她一個(gè)頭銜,我們最后笑著把她封為“全球運(yùn)營(yíng)總監(jiān)”。
主持人:希望她把這寫進(jìn) LinkedIn。
Brendan Foody:還沒(méi),不過(guò)也許以后會(huì)加上。
主持人:你說(shuō)自己開過(guò)十幾家公司。
Brendan Foody:算是十幾個(gè)項(xiàng)目吧,但真正做大的就是甜甜圈生意和 AWS 公司。
主持人:那“Mercor” 這個(gè)名字有什么故事?
Brendan Foody:“Mercor” 在拉丁語(yǔ)里是市場(chǎng)、買賣、交易的意思。我們想打造全球最大的市場(chǎng),一個(gè)所有人找工作的市場(chǎng)。所以就取了這個(gè)名字。
寫eval的專家,正在創(chuàng)造最高增速的公司
主持人:好的。最后一個(gè)問(wèn)題吧?;氐角懊娴脑掝}:現(xiàn)在大家都說(shuō),過(guò)去是“數(shù)據(jù)驅(qū)動(dòng)模型”,現(xiàn)在變成“專家驅(qū)動(dòng)模型”。你覺(jué)得下一步是什么?會(huì)不會(huì)走向 AGI?
Brendan Foody:我不覺(jué)得是從“數(shù)據(jù)”轉(zhuǎn)向“專家”,更準(zhǔn)確地說(shuō)是:實(shí)驗(yàn)室必須和專家密切合作,來(lái)設(shè)計(jì)好評(píng)測(cè)(evals),推動(dòng)模型前沿。很清楚的一點(diǎn)是,只要我們還想提升模型,就需要專家來(lái)設(shè)計(jì)評(píng)測(cè),提供后訓(xùn)練數(shù)據(jù),讓模型學(xué)到能力。當(dāng)然,訓(xùn)練方式可能會(huì)變,比如不同的 RL 方法,但始終都需要評(píng)測(cè)來(lái)衡量在各個(gè)領(lǐng)域里什么才是成功。
三年內(nèi)不會(huì)有超級(jí)智能
主持人:好,那在這個(gè)基礎(chǔ)上,我想問(wèn)一個(gè)現(xiàn)在常被提起的問(wèn)題。規(guī)模定律以及模型智能的進(jìn)展。很多人覺(jué)得,好像放緩了。按照這樣的速度,我們可能真的無(wú)法達(dá)到超級(jí)智能。你的看法是什么?
Brendan Foody:我完全同意這種看法。雖然有些大實(shí)驗(yàn)室的高管說(shuō)我們?nèi)陜?nèi)會(huì)有超級(jí)智能,但我認(rèn)為事實(shí)是,這條路會(huì)更長(zhǎng)。這并不是貶低當(dāng)前模型的能力——我認(rèn)為在未來(lái)十年內(nèi),我們一定能自動(dòng)化掉大多數(shù)知識(shí)型工作的任務(wù)。但這條漫長(zhǎng)的道路,靠的將是各種評(píng)測(cè)(evals),幫助模型獲得這些能力。實(shí)現(xiàn)這一切的關(guān)鍵不在于“再多10倍的預(yù)訓(xùn)練數(shù)據(jù)”,而在于更高效、更精心設(shè)計(jì)的后訓(xùn)練數(shù)據(jù)集,它們才會(huì)推動(dòng)能力進(jìn)化。
主持人:David Sachs 曾經(jīng)發(fā)過(guò)一條推文,說(shuō)我們現(xiàn)在的情況其實(shí)是最佳情境:AI 沒(méi)有進(jìn)入極速躍升到超級(jí)智能的狀態(tài);有很多競(jìng)爭(zhēng)者彼此制衡;模型已經(jīng)很有價(jià)值,而且越來(lái)越有價(jià)值;但并沒(méi)有出現(xiàn)某個(gè)“贏家”型超級(jí)智能主宰世界的局面。
Brendan Foody:是的,我覺(jué)得這沒(méi)錯(cuò)。我認(rèn)為關(guān)于超級(jí)智能的恐慌有些被夸大了。但同時(shí),很多人的框架是:即便只有 5%-10% 的概率會(huì)出現(xiàn)這種情況,我們也該保持謹(jǐn)慎——這聽上去也合理。但我覺(jué)得未來(lái)十年對(duì)硅谷乃至全世界來(lái)說(shuō)都會(huì)是非凡的,因?yàn)檫@項(xiàng)技術(shù)能夠帶來(lái)真正的豐?!屆總€(gè)人都能獲得更好的醫(yī)療、更優(yōu)質(zhì)的法律咨詢,以及前所未有的產(chǎn)品創(chuàng)造能力。
主持人:教育也正在被徹底改變。
主持人:完全正確,對(duì)嗎?
Brendan Foody:是的,我自己這十年來(lái)也深有體會(huì)。比如我記得大學(xué)時(shí),父母總批評(píng)我不去上課,但我當(dāng)時(shí)就覺(jué)得,YouTube 上的課程講得更好,為什么不直接在那里學(xué)?而且我可以想象,當(dāng)模型的表達(dá)和教學(xué)能力遠(yuǎn)超最好的教授時(shí),這意味著什么——獲取各種知識(shí)的門檻大大降低,推動(dòng)人類進(jìn)步和全民技能提升。
AI產(chǎn)品漫談:喜歡ChatGPT語(yǔ)音模式、AI玩寵、Codex
主持人:那我就借這個(gè)問(wèn)題,進(jìn)入今天的最后一個(gè)環(huán)節(jié)——AI 角落,這是我們播客的固定環(huán)節(jié)。你個(gè)人是怎么用 AI 來(lái)幫助工作或生活的?
Brendan Foody:我主要用它來(lái)寫文檔,這個(gè)很自然。另外,我也會(huì)和它對(duì)話,尋求建議。我覺(jué)得它就像一個(gè)思考伙伴,幫我理清思路。因?yàn)橛袝r(shí)候,跟同事或身邊的人不能把所有想法都說(shuō)出來(lái),但和 AI 聊,我就能更好地思考。
主持人:所以主要是用 ChatGPT 的語(yǔ)音模式?
Brendan Foody:是的,我很喜歡 ChatGPT 的語(yǔ)音模式,雖然還有改進(jìn)空間,但我對(duì)語(yǔ)音的未來(lái)非常興奮。
主持人:讓我給你看看我做的一個(gè)小東西。我原本沒(méi)打算提這個(gè)。有個(gè)叫 Eric Antoneau 的人,很多人推薦過(guò)他。他是個(gè)很有創(chuàng)造力的產(chǎn)品人,之前在 Facebook 待過(guò)。他做了一個(gè)叫 ParrotGPT 的項(xiàng)目,把 ChatGPT 塞進(jìn)毛絨玩具里,可以對(duì)話。他做了一只智慧小貓頭鷹,我現(xiàn)在沒(méi)帶過(guò)來(lái)?;驹砭褪窃谕婢呃锟p一個(gè)小音箱,肩膀上貼一個(gè)磁鐵,就能隨時(shí)對(duì)話。
Brendan Foody:太棒了,兄弟。我愛(ài)死了,我一定要搞一個(gè)。我家里已經(jīng)有一些語(yǔ)音助手,但我更想要一個(gè) ChatGPT 語(yǔ)音助手。我真的很期待。我剛才還在想這個(gè)事。
主持人:是啊,為什么不能有一個(gè) ChatGPT 語(yǔ)音助手,就隨時(shí)在旁邊聽?而不是像手機(jī)那樣休眠,你得喊它一聲“嘿”。
Brendan Foody:沒(méi)錯(cuò),正是這樣。
主持人:好吧,他還在做 Kickstarter,我們會(huì)把鏈接貼出來(lái),大家可以去支持。Brendan,在進(jìn)入最后的閃電問(wèn)答環(huán)節(jié)之前,你還有什么想補(bǔ)充的嗎?
Brendan Foody:呼應(yīng)我們剛才談到的“主動(dòng)性”這個(gè)話題,我想鼓勵(lì)大家:尤其在 AI 時(shí)代,構(gòu)建產(chǎn)品和嘗試的門檻已經(jīng)低得多了,所以請(qǐng)邁出那一步,去做,去和用戶交流,去嘗試。因?yàn)槲矣X(jué)得,最大的障礙就是缺乏主動(dòng)行動(dòng)。只要我們能降低這一障礙,就會(huì)有更多創(chuàng)新。
主持人:對(duì)?,F(xiàn)在太多人光是聽播客、看文章,但就是不去實(shí)踐。而如今,已經(jīng)是史上最容易動(dòng)手構(gòu)建、動(dòng)手嘗試的時(shí)代了。所以,一定要記住:Just do it。就像你當(dāng)年把甜甜圈攤往外挪了 50 英尺一樣。好,Brendan,下面我們進(jìn)入快問(wèn)快答環(huán)節(jié),我有五個(gè)問(wèn)題準(zhǔn)備好了。你準(zhǔn)備好了嗎?
Brendan Foody:準(zhǔn)備好了。
主持人:第一個(gè)問(wèn)題:你最常推薦給別人的兩三本書?
Brendan Foody:《高效能管理》(High Output Management),這是一本關(guān)于如何運(yùn)營(yíng)公司的經(jīng)典;第二本是《從零到一》(Zero to One),大家都知道;第三本是《鞋狗》(Shoe Dog),我覺(jué)得它特別勵(lì)志。
主持人:最近你喜歡的一部電影或電視?。?/span>
Brendan Foody:我很喜歡《奧本海默》。我最喜歡的電視劇是《金裝律師》(Suits),雖然不是最近的。如果說(shuō)近期的話,就是《奧本海默》。
主持人:很酷。最近你發(fā)現(xiàn)并喜歡上的一個(gè)產(chǎn)品?
Brendan Foody:我很喜歡新版 Codex,我覺(jué)得它進(jìn)步巨大,非常驚艷。
主持人:你有沒(méi)有一句人生格言?
Brendan Foody:就是我們剛才說(shuō)的那句:You can just do stuff。勇敢邁出那一步。
主持人:我本以為你要說(shuō)“Can do”,畢竟這是你 Twitter 簽名。
Brendan Foody:也行,可以是“Can do”。
閱讀障礙者如何管理公司
主持人:兩句都不錯(cuò)。最后一個(gè)問(wèn)題:你之前說(shuō)過(guò)一個(gè)細(xì)節(jié),還沒(méi)對(duì)外分享過(guò),就是你其實(shí)有閱讀障礙(dyslexia)。
Brendan Foody:是的。
主持人:能和大家聊聊嗎?畢竟你在這樣的情況下,還建立了史上增長(zhǎng)最快的公司。
Brendan Foody:我從不隱瞞,很多同事都知道。閱讀障礙確實(shí)讓處理大量郵件或文件很困難。但另一方面,它讓我思考方式不同,更有創(chuàng)造力,能看到別人未必注意到的市場(chǎng)變化。從管理角度來(lái)說(shuō),它讓我意識(shí)到:更應(yīng)該發(fā)揮團(tuán)隊(duì)成員的長(zhǎng)處,而不是執(zhí)著去彌補(bǔ)短板。因?yàn)橛行┦挛以僭趺淳氁膊粫?huì)做到最好,但我可以在自己的強(qiáng)項(xiàng)上不斷精進(jìn)。
主持人:這是我們節(jié)目里經(jīng)常出現(xiàn)的主題:專注優(yōu)勢(shì),而不是過(guò)度糾結(jié)于弱點(diǎn)。Brendan,這期節(jié)目太精彩了,我學(xué)到很多。最后兩個(gè)問(wèn)題:第一,大家應(yīng)該知道 Mercor 現(xiàn)在在做什么、招什么崗位?第二,聽眾怎么能幫到你們?
Brendan Foody:當(dāng)然。我們正在大量招聘:運(yùn)營(yíng)團(tuán)隊(duì)的戰(zhàn)略項(xiàng)目負(fù)責(zé)人、工程團(tuán)隊(duì)的軟件工程師、研究員等等。大家可以直接去 Mercor.com 應(yīng)聘。也歡迎推薦朋友,因?yàn)槲覀兤脚_(tái)超過(guò)一半的人才都來(lái)自轉(zhuǎn)介紹。我們很希望和優(yōu)秀的人一起工作。這就是大家能幫到我們最大的方式。
主持人:太棒了。謝謝你來(lái)參加。
Brendan Foody:謝謝邀請(qǐng)。
主持人:好的,各位,再見!
好了今天的文章到這里就結(jié)束了。大模型已然走到了“evals”時(shí)代,更好的評(píng)估帶來(lái)更高質(zhì)量的模型和Agent,大家是否認(rèn)同呢?歡迎評(píng)論區(qū)交流。
































