突發(fā)｜思維鏈開(kāi)山作者Jason Wei被曝加入Meta，機(jī)器之心獨(dú)家證實(shí)：Slack沒(méi)了

2025-07-16 10:39:05

Meta 針對(duì) OpenAI 的挖人竟然還在繼續(xù)！

這或許是目前為止，扎克伯格挖走的最強(qiáng)技術(shù)人才。

就在剛剛，外媒 Wired 的一位資深 AI 領(lǐng)域記者爆料稱(chēng)，「多個(gè)消息源證實(shí)，OpenAI 知名研究員 Jason Wei 和另一位研究科學(xué)家 Hyung Won Chung 將雙雙離職，投奔 Meta?！?/span>

并且，他們二人的 Slack 賬號(hào)已經(jīng)被停用。機(jī)器之心也從 OpenAI 相關(guān)人士證實(shí)了該消息，「（Jason Wei）Slack 沒(méi)了」，但是否是加入 Meta 還有待進(jìn)一步證實(shí)。

Jason Wei 是 OpenAI 的知名科學(xué)家，目前 AI 大模型領(lǐng)域里重要技術(shù)思維鏈（CoT）的主要作者，Hyung Won Chung 也是 o1 的核心貢獻(xiàn)者之一。

image.png

Jason Wei 是 CoT 論文的第一作者，該論文的引用量已超過(guò) 1.7 萬(wàn)

如果你對(duì)他們的印象還不夠深，還記得去年 12 月 OpenAI 連續(xù)兩周的新產(chǎn)品發(fā)布會(huì)嗎？坐在奧特曼旁邊的就是 Hyung Won Chung，最右邊的是 Jason Wei。他倆都畢業(yè)于 MIT，曾在谷歌工作，現(xiàn)在可能一起去了 Meta。

爆料消息出來(lái)不久，Jason Wei 并沒(méi)有正面回應(yīng)，而是發(fā)了一篇推特，介紹其長(zhǎng)博客，探討了驗(yàn)證非對(duì)稱(chēng)性以及「驗(yàn)證者」法則。

但評(píng)論區(qū)看熱鬧的大家伙似乎已經(jīng)不關(guān)注他寫(xiě)了什么，都在恭喜他跳槽到 Meta。

在發(fā)了這篇技術(shù)博客沒(méi)多長(zhǎng)時(shí)間，Jason Wei 又發(fā)了一篇推特。

以下是原推內(nèi)容翻譯：

過(guò)去一年成為一名強(qiáng)化學(xué)習(xí)（RL）狂熱愛(ài)好者，并且清醒時(shí)大部分時(shí)間都在思考 RL，這無(wú)意中教會(huì)了我一個(gè)關(guān)于如何過(guò)好自己生活的重要道理。

RL 中的一個(gè)核心概念是，你總是希望處于「同策略（on-policy）」?fàn)顟B(tài)：與其模仿別人成功的軌跡，不如采取自己的行動(dòng)，并從環(huán)境給予的獎(jiǎng)勵(lì)中學(xué)習(xí)。顯然，模仿學(xué)習(xí)（imitation learning）在最初引導(dǎo)模型達(dá)到非零通過(guò)率時(shí)很有用，但一旦模型能走出合理的軌跡，我們通常就會(huì)避免模仿學(xué)習(xí)，因?yàn)橐浞职l(fā)揮模型自身（與人類(lèi)不同）優(yōu)勢(shì)的最佳方式是只從它自己的軌跡中學(xué)習(xí)。一個(gè)被廣泛接受的實(shí)例是：在訓(xùn)練語(yǔ)言模型解決數(shù)學(xué)應(yīng)用題方面，強(qiáng)化學(xué)習(xí)比簡(jiǎn)單地用人類(lèi)編寫(xiě)的思維鏈進(jìn)行監(jiān)督微調(diào)效果更好。

人生也是如此。我們最初通過(guò)模仿學(xué)習(xí)（學(xué)校教育）來(lái)引導(dǎo)自己，這非常合理。但即使在我畢業(yè)后，仍有一個(gè)習(xí)慣：研究別人如何取得成功并試圖模仿他們。有時(shí)會(huì)奏效，但最終我意識(shí)到，我永遠(yuǎn)無(wú)法完全超越他人，因?yàn)樗麄兪窃诎l(fā)揮他們的優(yōu)勢(shì)，而這些優(yōu)勢(shì)我可能并不具備。這可能是某位研究人員比我更成功地進(jìn)行大膽嘗試（運(yùn)行 yolo），因?yàn)樗麄冇H自搭建了代碼庫(kù)而我沒(méi)有；或者一個(gè)非 AI 的例子：一位足球運(yùn)動(dòng)員利用我不具備的力量?jī)?yōu)勢(shì)保持控球權(quán)。

進(jìn)行同策略 RL 帶來(lái)的啟示是：要超越前輩（beat the teacher），必須走自己的路，承擔(dān)風(fēng)險(xiǎn)并從環(huán)境中獲取回報(bào)。例如，比起一般的研究人員，我更喜歡做兩件事：(1) 大量審閱數(shù)據(jù)，(2) 進(jìn)行消融研究以理解系統(tǒng)中各個(gè)組件的作用。有一次在收集數(shù)據(jù)集時(shí)，我花了幾天時(shí)間審閱數(shù)據(jù)并給每位人類(lèi)標(biāo)注員提供個(gè)性化反饋，之后數(shù)據(jù)質(zhì)量變得極佳，并且我對(duì)要解決的任務(wù)獲得了寶貴的見(jiàn)解。今年早些時(shí)候，我花了一個(gè)月時(shí)間回溯并逐一消融研究之前在做深度研究時(shí)嘗試做的每個(gè)決策。這花費(fèi)了相當(dāng)多的時(shí)間，但通過(guò)這些實(shí)驗(yàn)，我學(xué)到了關(guān)于哪種類(lèi)型的 RL 效果好的獨(dú)特經(jīng)驗(yàn)。發(fā)揮自己的熱情讓我更有滿(mǎn)足感，而且我現(xiàn)在感覺(jué)自己正走在為自己和自己的研究開(kāi)辟一片更強(qiáng)大天地的道路上。

簡(jiǎn)而言之，模仿是好的，你必須在初始階段這樣做。但一旦你完成了足夠的引導(dǎo)，若想超越前輩，就必須進(jìn)行「同策略」的強(qiáng)化學(xué)習(xí)，學(xué)會(huì)揚(yáng)長(zhǎng)避短。

接下來(lái)，我們來(lái)看這兩位研究員的履歷。

Jason Wei

Jason Wei 是思維鏈（Chain of Thought，CoT）概念開(kāi)山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者，本科畢業(yè)就加入了谷歌。在那里，他推廣了思維鏈提示概念，共同領(lǐng)導(dǎo)了指令調(diào)優(yōu)的早期工作，并和 Yi Tay、Jeff Dean 等人合著了關(guān)于大模型涌現(xiàn)能力的論文。

2023 年 2 月，Jason Wei 加入 OpenAI，工作內(nèi)容包括了推理模型 o1 和深度研究模型。

image.png

在 Google Scholar 主頁(yè)上，Jason Wei 的論文引用量已經(jīng)超過(guò)了 77k，其中前兩位分別是 CoT 提示論文和 GPT-4 技術(shù)報(bào)告。

image.png

Hyung Won Chung

Hyung Won Chung 出生于韓國(guó)，OpenAI 研究科學(xué)家，專(zhuān)注于 LLM 的研究與應(yīng)用。

image.png

他博士畢業(yè)于麻省理工學(xué)院，之后曾在谷歌從事了三年多的研究工作，期間參與了 PaLM（具有 5400 億參數(shù)的大語(yǔ)言模型）、 BLOOM（ 1760 億參數(shù)的開(kāi)放式多語(yǔ)言模型）、Flan-T5 等多個(gè)重要項(xiàng)目的研發(fā)。

離開(kāi)谷歌后，Hyung Won Chung 于 2023 年加入 OpenAI。

image.png

在 OpenAI 工作期間，Hyung Won Chung 參與了多個(gè)重大項(xiàng)目的研究，特別在以下項(xiàng)目中扮演了關(guān)鍵角色：o1-preview（2024 年 9 月），o1 正式版（2024 年 12 月）、Deep Research（2025 年 2 月），以及領(lǐng)導(dǎo)了 Codex mini 模型訓(xùn)練。

在 OpenAI 一些重大發(fā)布會(huì)上，我們也經(jīng)常看到 Hyung Won Chung 的身影。

2025-07-16_094627.png

Hyung Won Chung 參與過(guò)的 OpenAI 一些發(fā)布會(huì)

作為 o1 系統(tǒng)的奠基貢獻(xiàn)者，他在開(kāi)發(fā)大語(yǔ)言模型的推理、搜索信息能力、以及使用強(qiáng)化學(xué)習(xí)策略方面發(fā)揮了重要作用。

Hyung Won Chung 還在多個(gè)重要場(chǎng)合分享洞見(jiàn)，包括斯坦福 CS25 講座廣受大家好評(píng)。

image.png

Hyung Won Chung 在 OpenAI 的研究工作中，他的貢獻(xiàn)不僅推動(dòng)了 o1 系列模型成為具有思考能力的前沿工具，也在編碼智能體、系統(tǒng)評(píng)估和安全保障方面開(kāi)辟了新路徑，形成了一個(gè)從理論到應(yīng)用、從開(kāi)發(fā)到普及的完整研究生態(tài)。

隨著 Jason Wei、Hyung Won Chung 兩位大佬級(jí)別的人員離開(kāi)，OpenAI 真的要被挖麻了。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

Meta AI 模型

偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

突發(fā)｜思維鏈開(kāi)山作者Jason Wei被曝加入Meta，機(jī)器之心獨(dú)家證實(shí)：Slack沒(méi)了

Jason Wei

Hyung Won Chung

突發(fā)｜思維鏈開(kāi)山作者Jason Wei被曝加入Meta，機(jī)器之心獨(dú)家證實(shí)：Slack沒(méi)了