偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

突發(fā)|思維鏈開(kāi)山作者Jason Wei被曝加入Meta,機(jī)器之心獨(dú)家證實(shí):Slack沒(méi)了

人工智能 新聞
Meta 針對(duì) OpenAI 的挖人竟然還在繼續(xù)!

這或許是目前為止,扎克伯格挖走的最強(qiáng)技術(shù)人才。

就在剛剛,外媒 Wired 的一位資深 AI 領(lǐng)域記者爆料稱(chēng),「多個(gè)消息源證實(shí),OpenAI 知名研究員 Jason Wei 和另一位研究科學(xué)家 Hyung Won Chung 將雙雙離職,投奔 Meta?!?/span>

并且,他們二人的 Slack 賬號(hào)已經(jīng)被停用。機(jī)器之心也從 OpenAI 相關(guān)人士證實(shí)了該消息,「(Jason Wei)Slack 沒(méi)了」,但是否是加入 Meta 還有待進(jìn)一步證實(shí)。

image.png

image.png

Jason Wei 是 OpenAI 的知名科學(xué)家,目前 AI 大模型領(lǐng)域里重要技術(shù)思維鏈(CoT)的主要作者,Hyung Won Chung 也是 o1 的核心貢獻(xiàn)者之一。

image.pngimage.png

Jason Wei 是 CoT 論文的第一作者,該論文的引用量已超過(guò) 1.7 萬(wàn)

如果你對(duì)他們的印象還不夠深,還記得去年 12 月 OpenAI 連續(xù)兩周的新產(chǎn)品發(fā)布會(huì)嗎?坐在奧特曼旁邊的就是 Hyung Won Chung,最右邊的是 Jason Wei。他倆都畢業(yè)于 MIT,曾在谷歌工作,現(xiàn)在可能一起去了 Meta。

圖片

爆料消息出來(lái)不久,Jason Wei 并沒(méi)有正面回應(yīng),而是發(fā)了一篇推特,介紹其長(zhǎng)博客,探討了驗(yàn)證非對(duì)稱(chēng)性以及「驗(yàn)證者」法則。

image.png

但評(píng)論區(qū)看熱鬧的大家伙似乎已經(jīng)不關(guān)注他寫(xiě)了什么,都在恭喜他跳槽到 Meta。

image.png

在發(fā)了這篇技術(shù)博客沒(méi)多長(zhǎng)時(shí)間,Jason Wei 又發(fā)了一篇推特。

image.png

以下是原推內(nèi)容翻譯:

過(guò)去一年成為一名強(qiáng)化學(xué)習(xí)(RL)狂熱愛(ài)好者,并且清醒時(shí)大部分時(shí)間都在思考 RL,這無(wú)意中教會(huì)了我一個(gè)關(guān)于如何過(guò)好自己生活的重要道理。

RL 中的一個(gè)核心概念是,你總是希望處于「同策略(on-policy)」?fàn)顟B(tài):與其模仿別人成功的軌跡,不如采取自己的行動(dòng),并從環(huán)境給予的獎(jiǎng)勵(lì)中學(xué)習(xí)。顯然,模仿學(xué)習(xí)(imitation learning)在最初引導(dǎo)模型達(dá)到非零通過(guò)率時(shí)很有用,但一旦模型能走出合理的軌跡,我們通常就會(huì)避免模仿學(xué)習(xí),因?yàn)橐浞职l(fā)揮模型自身(與人類(lèi)不同)優(yōu)勢(shì)的最佳方式是只從它自己的軌跡中學(xué)習(xí)。一個(gè)被廣泛接受的實(shí)例是:在訓(xùn)練語(yǔ)言模型解決數(shù)學(xué)應(yīng)用題方面,強(qiáng)化學(xué)習(xí)比簡(jiǎn)單地用人類(lèi)編寫(xiě)的思維鏈進(jìn)行監(jiān)督微調(diào)效果更好。

人生也是如此。我們最初通過(guò)模仿學(xué)習(xí)(學(xué)校教育)來(lái)引導(dǎo)自己,這非常合理。但即使在我畢業(yè)后,仍有一個(gè)習(xí)慣:研究別人如何取得成功并試圖模仿他們。有時(shí)會(huì)奏效,但最終我意識(shí)到,我永遠(yuǎn)無(wú)法完全超越他人,因?yàn)樗麄兪窃诎l(fā)揮他們的優(yōu)勢(shì),而這些優(yōu)勢(shì)我可能并不具備。這可能是某位研究人員比我更成功地進(jìn)行大膽嘗試(運(yùn)行 yolo),因?yàn)樗麄冇H自搭建了代碼庫(kù)而我沒(méi)有;或者一個(gè)非 AI 的例子:一位足球運(yùn)動(dòng)員利用我不具備的力量?jī)?yōu)勢(shì)保持控球權(quán)。

進(jìn)行同策略 RL 帶來(lái)的啟示是:要超越前輩(beat the teacher),必須走自己的路,承擔(dān)風(fēng)險(xiǎn)并從環(huán)境中獲取回報(bào)。例如,比起一般的研究人員,我更喜歡做兩件事:(1) 大量審閱數(shù)據(jù),(2) 進(jìn)行消融研究以理解系統(tǒng)中各個(gè)組件的作用。有一次在收集數(shù)據(jù)集時(shí),我花了幾天時(shí)間審閱數(shù)據(jù)并給每位人類(lèi)標(biāo)注員提供個(gè)性化反饋,之后數(shù)據(jù)質(zhì)量變得極佳,并且我對(duì)要解決的任務(wù)獲得了寶貴的見(jiàn)解。今年早些時(shí)候,我花了一個(gè)月時(shí)間回溯并逐一消融研究之前在做深度研究時(shí)嘗試做的每個(gè)決策。這花費(fèi)了相當(dāng)多的時(shí)間,但通過(guò)這些實(shí)驗(yàn),我學(xué)到了關(guān)于哪種類(lèi)型的 RL 效果好的獨(dú)特經(jīng)驗(yàn)。發(fā)揮自己的熱情讓我更有滿(mǎn)足感,而且我現(xiàn)在感覺(jué)自己正走在為自己和自己的研究開(kāi)辟一片更強(qiáng)大天地的道路上。

簡(jiǎn)而言之,模仿是好的,你必須在初始階段這樣做。但一旦你完成了足夠的引導(dǎo),若想超越前輩,就必須進(jìn)行「同策略」的強(qiáng)化學(xué)習(xí),學(xué)會(huì)揚(yáng)長(zhǎng)避短。

接下來(lái),我們來(lái)看這兩位研究員的履歷。

Jason Wei

Jason Wei 是思維鏈(Chain of Thought,CoT)概念開(kāi)山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者,本科畢業(yè)就加入了谷歌。在那里,他推廣了思維鏈提示概念,共同領(lǐng)導(dǎo)了指令調(diào)優(yōu)的早期工作,并和 Yi Tay、Jeff Dean 等人合著了關(guān)于大模型涌現(xiàn)能力的論文。

2023 年 2 月,Jason Wei 加入 OpenAI,工作內(nèi)容包括了推理模型 o1 和深度研究模型。

image.pngimage.png

在 Google Scholar 主頁(yè)上,Jason Wei 的論文引用量已經(jīng)超過(guò)了 77k,其中前兩位分別是 CoT 提示論文和 GPT-4 技術(shù)報(bào)告。

image.pngimage.png

Hyung Won Chung

Hyung Won Chung 出生于韓國(guó),OpenAI 研究科學(xué)家,專(zhuān)注于 LLM 的研究與應(yīng)用。

image.pngimage.png

他博士畢業(yè)于麻省理工學(xué)院,之后曾在谷歌從事了三年多的研究工作,期間參與了 PaLM(具有 5400 億參數(shù)的大語(yǔ)言模型)、 BLOOM( 1760 億參數(shù)的開(kāi)放式多語(yǔ)言模型)、Flan-T5 等多個(gè)重要項(xiàng)目的研發(fā)。

離開(kāi)谷歌后,Hyung Won Chung 于 2023 年加入 OpenAI。

image.pngimage.png

在 OpenAI 工作期間,Hyung Won Chung 參與了多個(gè)重大項(xiàng)目的研究, 特別在以下項(xiàng)目中扮演了關(guān)鍵角色:o1-preview(2024 年 9 月),o1 正式版(2024 年 12 月)、Deep Research(2025 年 2 月),以及領(lǐng)導(dǎo)了 Codex mini 模型訓(xùn)練。

在 OpenAI 一些重大發(fā)布會(huì)上,我們也經(jīng)常看到 Hyung Won Chung 的身影。

2025-07-16_094627.png2025-07-16_094627.png

Hyung Won Chung 參與過(guò)的 OpenAI 一些發(fā)布會(huì)

作為 o1 系統(tǒng)的奠基貢獻(xiàn)者,他在開(kāi)發(fā)大語(yǔ)言模型的推理、搜索信息能力、以及使用強(qiáng)化學(xué)習(xí)策略方面發(fā)揮了重要作用。

Hyung Won Chung 還在多個(gè)重要場(chǎng)合分享洞見(jiàn),包括斯坦福 CS25 講座廣受大家好評(píng)。

image.pngimage.png

Hyung Won Chung 在 OpenAI 的研究工作中,他的貢獻(xiàn)不僅推動(dòng)了 o1 系列模型成為具有思考能力的前沿工具,也在編碼智能體、系統(tǒng)評(píng)估和安全保障方面開(kāi)辟了新路徑,形成了一個(gè)從理論到應(yīng)用、從開(kāi)發(fā)到普及的完整研究生態(tài)。 

隨著 Jason Wei、Hyung Won Chung 兩位大佬級(jí)別的人員離開(kāi),OpenAI 真的要被挖麻了。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-01-06 07:05:00

2023-12-07 10:11:20

模型AI

2023-09-06 12:56:23

智能訓(xùn)練

2024-09-26 08:21:41

2023-07-24 12:30:36

谷歌AI

2024-10-18 16:00:00

AI英特爾IT

2020-06-19 14:55:14

信息泄漏惡意軟件攻擊

2024-05-27 12:45:53

2016-12-29 15:31:13

機(jī)器學(xué)習(xí)計(jì)算數(shù)據(jù)

2024-12-19 09:48:07

2023-11-18 09:09:44

OpenAI微軟

2021-07-12 09:11:23

華為谷歌除名

2019-12-16 08:29:37

NginxRambler程序

2025-06-26 15:07:54

OpenAIMeta模型

2020-10-12 09:43:41

iOS 14漏洞蘋(píng)果

2024-12-18 14:53:28

2024-05-09 11:24:20

AI論文

2025-02-07 11:20:50

2025-03-11 13:54:11

2025-07-08 09:15:21

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)