偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

GPT-5難產(chǎn),外媒爆料:性能提升不大,OpenAI高管Slack上當(dāng)眾破防

人工智能 新聞
8 月 1 日,The Information 更是洋洋灑灑寫了一篇名為《Inside OpenAI’s Rocky Path to GPT-5》的長(zhǎng)文,扒出了 GPT-5 的更多內(nèi)幕。

GPT-5 遲遲未現(xiàn)身,網(wǎng)友們開始制作各種梗圖「吐槽」:

image.png

image.png

其實(shí),這幾天關(guān)于 GPT-5 的傳言就沒消停。

先是有網(wǎng)友在 macOS ChatGPT 應(yīng)用中發(fā)現(xiàn)了 GPT-5-Auto 和 GPT-5-Reasoning 模型的蹤跡:

image.png

再是網(wǎng)友爆料微軟 Copilot 和 Cursor 也已經(jīng)悄咪咪接入測(cè)試GPT-5。

8 月 1 日,The Information 更是洋洋灑灑寫了一篇名為《Inside OpenAI’s Rocky Path to GPT-5》的長(zhǎng)文,扒出了 GPT-5 的更多內(nèi)幕。

以下是省流版:

  • GPT-5 將比其前代產(chǎn)品有真正的改進(jìn),但無法與早期 GPT 品牌型號(hào)之間的性能飛躍相提并論。
  • OpenAI 在今年面臨了一系列技術(shù)問題,這些問題威脅到了 o3 和其他模型的進(jìn)展。
  • Meta 挖人把 OpenAI 高管搞「破防」,在 Slack 中向上司公開抱怨團(tuán)隊(duì)變動(dòng)。

接下來,我們就詳細(xì)來吃個(gè)瓜。

GPT-5 有改進(jìn),但性能飛躍大不如前

去年 12 月,OpenAI 展示了 Test-Time Scaling 的測(cè)試結(jié)果,成為后預(yù)訓(xùn)練時(shí)代大模型能力的關(guān)鍵突破口。該測(cè)試表明,當(dāng) AI 擁有更多時(shí)間和計(jì)算能力來處理任務(wù)時(shí),其性能會(huì)持續(xù)增加,這一技術(shù)路徑在 OpenAI-o1 和 DeepSeek-R1 的實(shí)踐中已經(jīng)初顯威力??雌饋?,廣大 ChatGPT 用戶會(huì)被新 AI 的強(qiáng)大功能所震撼。

然而,興奮勁并沒有持續(xù)太久。

據(jù)兩位參與開發(fā)的人透露,當(dāng) OpenAI 的研究人員將這款新 AI 改造成基于聊天的版本 o3,使其能夠響應(yīng) ChatGPT 用戶的指令時(shí),之前測(cè)試基準(zhǔn)上的性能提升基本消失了。

這只是 OpenAI 今年面臨的大量技術(shù)挑戰(zhàn)的一個(gè)例子,越來越多的困難正在減緩 AI 發(fā)展的步伐,甚至可能影響到 AI 爆款應(yīng)用 ChatGPT 業(yè)務(wù)。

在即將發(fā)布的 GPT-5 上,OpenAI 研究人員據(jù)說已經(jīng)找到了方法。

據(jù)消息人士和 OpenAI 內(nèi)部工程師稱,OpenAI 即將發(fā)布的一代旗艦 AI 模型 GPT-5,在編程、數(shù)學(xué)等方面的能力有很大提升。

一個(gè)消息人士表示,新模型在編寫應(yīng)用程序代碼時(shí),能夠更好地添加功能,使其更易于使用且更美觀。他表示,GPT-5 在驅(qū)動(dòng) AI 智能體以極少的人工監(jiān)督處理復(fù)雜任務(wù)方面也比其前代產(chǎn)品做得更好。例如它可以遵循復(fù)雜的指令,確定自動(dòng)客服何時(shí)應(yīng)該退款的規(guī)則列表,此前的模型需要先測(cè)試幾個(gè)棘手的客戶案例(即邊緣案例),才能處理此類退款。

另一位知情人士表示,這些改進(jìn)無法與早期 GPT 模型的性能飛躍相提并論,例如 2020 年的 GPT-3 和 2023 年的 GPT-4 之間的改進(jìn)。OpenAI 在過去 12 個(gè)月中經(jīng)歷的性能提升放緩表明,它可能很難超出其最大的競(jìng)爭(zhēng)對(duì)手,至少在 AI 能力方面是這樣。

OpenAI 目前的模型通過 ChatGPT 和各類應(yīng)用已經(jīng)創(chuàng)造了巨大的商業(yè)價(jià)值,即使是漸進(jìn)式的改進(jìn),都會(huì)增加客戶需求。這些改進(jìn)還能讓投資者有信心為 OpenAI 未來三年半內(nèi)斥資 450 億美元購(gòu)買 GPU,開發(fā)和運(yùn)行產(chǎn)品的計(jì)劃提供資金。

提升自動(dòng)化編碼能力成 OpenAI 首要任務(wù)

最近的進(jìn)展也幫助解釋了為什么 OpenAI 高管最近幾周告訴一些投資者,他們認(rèn)為公司可以實(shí)現(xiàn)「GPT-8」這一目標(biāo)。這一表態(tài)與 CEO 山姆?奧特曼公開的言論一致,他表示,憑借現(xiàn)有的技術(shù)知識(shí),OpenAI 有望創(chuàng)造出與最聰明人類能力相媲美的人工智能技術(shù),即 AGI。

雖然距離實(shí)現(xiàn) AGI 仍有很長(zhǎng)的路要走,但即將發(fā)布的 GPT-5 模型可能具有一些除了更好的編碼和推理之外的其他吸引力。

據(jù)一位知情的微軟員工透露, 微軟擁有 OpenAI 知識(shí)產(chǎn)權(quán)的獨(dú)家使用權(quán),該公司的一些領(lǐng)導(dǎo)層告訴員工,他們測(cè)試該模型的結(jié)果顯示,GPT-5 能夠在不消耗更多計(jì)算資源的情況下,生成更高質(zhì)量的編碼和其他基于文本的答案。

該人士表示,部分原因是它能夠比之前的模型更好地判斷哪些任務(wù)需要相對(duì)更多或更少的計(jì)算資源。

OpenAI 的內(nèi)部評(píng)估顯示, 在去年競(jìng)爭(zhēng)對(duì)手 Anthropic 率先開發(fā)并向軟件開發(fā)人員和 Cursor 等編碼助手銷售此類模型后,提升人工智能自動(dòng)執(zhí)行編碼任務(wù)的能力已成為 OpenAI 的首要任務(wù)。

OpenAI 員工認(rèn)為,自動(dòng)編碼不僅對(duì)公司業(yè)務(wù)至關(guān)重要, 對(duì)于實(shí)現(xiàn)人工智能研究人員自身工作的自動(dòng)化也至關(guān)重要 。

組織重組的壓力

OpenAI 的進(jìn)展并非一帆風(fēng)順,因?yàn)槠溲芯咳藛T和管理層今年都面臨著新的壓力。

首先是和微軟之間微妙的關(guān)系。

盡管微軟是 OpenAI 最大的外部股東,并且根據(jù)雙方的合同協(xié)議,微軟有權(quán)在 2030 年之前使用 OpenAI 的一些技術(shù),但一些 OpenAI 的高級(jí)研究人員并不贊同將他們的創(chuàng)新和發(fā)明交給微軟。

在財(cái)務(wù)方面,微軟和 OpenAI 也有著非常緊密的合作關(guān)系,但在合作的具體條款上存在爭(zhēng)議,雙方都在要求對(duì)方做出一些讓步。

OpenAI 希望通過重組其營(yíng)利性部門,來為將來上市做準(zhǔn)備。雖然雙方在一些細(xì)節(jié)上仍然存在不確定性,但已經(jīng)有一些重要的方面達(dá)成了初步的共識(shí),比如微軟可能會(huì)在 OpenAI 重組后獲得約 33% 的股權(quán)。

其次就是 Meta 不斷「撬墻角」。

最近,Meta 狠砸真金白銀,從 OpenAI 挖去了十多位研究人員,其中一些還曾參與了 OpenAI 近期改進(jìn)技術(shù)的工作。

這些人才流失和隨之而來的人員調(diào)整,給 OpenAI 的管理層帶來了壓力。

上周,OpenAI 的研究副總裁 Jerry Tworek 在公司內(nèi)部的 Slack 中,向他的上司 Mark Chen 抱怨了團(tuán)隊(duì)的變動(dòng),而許多同事都看到了他的抱怨。Tworek 表示,他必須休息一周來重新評(píng)估情況,但后來他并沒有休假。

Orion 模型的「失利」

雖然 OpenAI 在商業(yè)上取得了一些進(jìn)展,但公司內(nèi)部對(duì)能否持續(xù)改進(jìn) AI 并保持領(lǐng)先地位仍然存在一些擔(dān)憂,特別是面對(duì)像 Google、xAI 和 Anthropic 這樣的資金雄厚的競(jìng)爭(zhēng)對(duì)手。

2024 年下半年,OpenAI 開發(fā)了一個(gè)名為 Orion 的模型,原計(jì)劃將其作為 GPT-5 發(fā)布,并預(yù)計(jì)其性能會(huì)比現(xiàn)有的 GPT-4o 模型更強(qiáng)。然而,Orion 并未達(dá)到預(yù)期的提升效果,因此 OpenAI 將其發(fā)布為 GPT-4.5 模型,結(jié)果這個(gè)模型的影響力似乎也沒多大。

Orion 未能成功的部分原因在于其預(yù)訓(xùn)練階段的局限性。預(yù)訓(xùn)練是模型開發(fā)的第一步,模型需要處理大量數(shù)據(jù)以便理解不同概念之間的聯(lián)系。OpenAI 在面臨高質(zhì)量數(shù)據(jù)匱乏的同時(shí),還發(fā)現(xiàn)對(duì) Orion 模型做的優(yōu)化在模型較小的時(shí)候有效,但當(dāng)模型規(guī)模增大時(shí),這些優(yōu)化就不再有效了。

 o3 實(shí)力強(qiáng)勁得益于更多的英偉達(dá)芯片

此外,OpenAI 的研究人員還面臨其他問題。

 去年,OpenAI 開發(fā)了推理模型,這些模型在獲得更多計(jì)算資源以處理答案時(shí)表現(xiàn)得更好。這些模型源自 2023 年末的一項(xiàng)名為 Q * 的突破,這一突破震驚了公司的研究人員,因?yàn)樗軌蚪鉀Q之前從未見過的數(shù)學(xué)問題。到 2024 年,推理模型似乎幫助公司克服了預(yù)訓(xùn)練階段性能增長(zhǎng)放緩的問題。

 去年秋天,OpenAI 將第一個(gè)主要推理模型變成了 o1。此次發(fā)布為 OpenAI 在 AI 領(lǐng)域贏得了新的影響力,并為依賴推理模型的 AI Agent 開發(fā)奠定了基礎(chǔ).

據(jù)參與開發(fā)的人士透露,OpenAI 在 2024 年底之前創(chuàng)建了下一個(gè)推理模型 o3,其基礎(chǔ)大語(yǔ)言模型與 o1 相同,都是 GPT-4o。盡管 o3 和 o1 擁有相同的模型血統(tǒng),但 o3 的母模型(也稱為教師模型)在理解各種科學(xué)領(lǐng)域及其他領(lǐng)域方面,相比 o1 的母模型取得了顯著的進(jìn)步。

進(jìn)步的一個(gè)原因是 OpenAI 決定使用更多的英偉達(dá)芯片服務(wù)器來開發(fā) o3 的母模型,這本質(zhì)上為模型提供了更強(qiáng)的處理能力,以理解復(fù)雜的概念。

另一個(gè)原因是,研究人員賦予了 o3 母模型搜索網(wǎng)絡(luò)或從代碼庫(kù)中獲取信息的能力,這也幫助其性能超越了 o1 的母模型。

兩個(gè)月前開發(fā)的模型都稱不上 GPT-5

OpenAI 公開分享了針對(duì)該模型優(yōu)勢(shì)的特殊測(cè)試結(jié)果,不僅登上了全球頭條,還在社交媒體上引發(fā)了瘋狂的炒作,但隨后現(xiàn)實(shí)擺在了面前。

參與開發(fā)的人員表示,當(dāng) OpenAI 將 o3 母模型轉(zhuǎn)換為能讓人們提問的 ChatGPT 版本(也稱為學(xué)生模型)時(shí),其收益顯著下降,甚至比 o1 表現(xiàn)好不了多少。他們表示,當(dāng) OpenAI 創(chuàng)建商用 API 的模型版本時(shí),也出現(xiàn)了同樣的問題。

有知情人士表示,造成這種情況的原因之一與該模型理解概念的獨(dú)特方式有關(guān),這可能與人類的溝通方式不同。他表示,創(chuàng)建基于聊天的版本實(shí)際上會(huì)降低原始模型的水平,因?yàn)樗枰黄仁褂萌祟愓Z(yǔ)言而不是自己的語(yǔ)言。

我們知道,推理模型在 ChatGPT 中「思考」如何解決問題時(shí)有時(shí)會(huì)出現(xiàn)的胡言亂語(yǔ),就反映了一些溝通差異。

image.png

據(jù)另一位知情人士透露,該公司也沒有花費(fèi)太多精力以能與人類更好溝通的目標(biāo)進(jìn)行訓(xùn)練。

盡管有所退步,OpenAI 今年公開發(fā)布的 o3 推理模型仍然幫助核聚變和病原體檢測(cè)等領(lǐng)域的科學(xué)家提出了新的假設(shè)和實(shí)驗(yàn)進(jìn)行測(cè)試。

然而,大語(yǔ)言模型和 ChatGPT 中的模型并沒有像 OpenAI 高管和研究人員預(yù)期的那樣順利。奧特曼告訴員工,o 系列模型似乎也讓 ChatGPT 的客戶感到困惑,因此該公司恢復(fù)了原來 GPT 模型的命名規(guī)律。

據(jù)一位參與 GPT-5 開發(fā)的人士透露,就在 6 月份由于技術(shù)問題,OpenAI 正在開發(fā)的模型似乎都不足以被貼上 GPT-5 的標(biāo)簽。

GPT-5 的技術(shù),還有最后的王牌

盡管如此,OpenAI 仍有一招:據(jù)一位知情人士透露,他們一直在開發(fā)一種研究人員稱之為「通用驗(yàn)證器」(universal verifier)的東西,可以自動(dòng)執(zhí)行確保模型在強(qiáng)化學(xué)習(xí)過程中生成高質(zhì)量答案的過程。這個(gè)過程本質(zhì)上是讓一個(gè)大語(yǔ)言模型使用各種來源的研究來檢查和評(píng)分另一個(gè)模型的答案。

今年夏初,OpenAI 的未公開模型實(shí)現(xiàn) IMO 金牌成績(jī)后,高級(jí)研究員 Alexander Wei 在 X 上表示,其一直在使用的強(qiáng)化學(xué)習(xí)方法是「通用的」,這意味著它也可以驗(yàn)證更主觀類別中答案的質(zhì)量。

alexander wei.png

這些進(jìn)步似乎也在幫助 OpenAI 開發(fā) GPT-5,GPT-5 在軟件編程等更易驗(yàn)證的領(lǐng)域和創(chuàng)意寫作等更主觀的領(lǐng)域都表現(xiàn)出了進(jìn)步。

包括 xAI 和谷歌在內(nèi)的其他公司也極為重視強(qiáng)化學(xué)習(xí),將其視為改進(jìn) AI 模型的有前景的技術(shù)。OpenAI 強(qiáng)化學(xué)習(xí)部門負(fù)責(zé)人 Tworek 最近公開表示,他贊同 OpenAI 模型背后的強(qiáng)化學(xué)習(xí)系統(tǒng)才是通用人工智能(AGI)的真正構(gòu)成要素。

OpenAI 即將發(fā)布的 GPT-5 被人們寄予厚望。山姆?奧特曼上周在與喜劇演員 Theo Von 的播客中大肆宣傳 GPT-5 的功能,并介紹了該模型如何輕松回答他不理解的問題。奧特曼表示,「GPT-5 幾乎在所有方面都比我們更聰明。」

也正是因?yàn)榍熬安诲e(cuò),OpenAI 在最新一輪的融資上進(jìn)展非常順利。

新一輪融資,風(fēng)投搶著買單

據(jù)《紐約時(shí)報(bào)》本周五報(bào)道,OpenAI 剛剛又融資了 83 億美元,估值達(dá)到 3000 億美元。這筆交易是 OpenAI 今年籌集 400 億美元資金的更廣泛戰(zhàn)略的一部分。

據(jù)報(bào)道,這輪融資超額完成,比原計(jì)劃提前了幾個(gè)月。OpenAI 最初在 3 月份從風(fēng)投公司籌集了 25 億美元,當(dāng)時(shí)該公司宣布計(jì)劃在由軟銀領(lǐng)投的一輪融資中籌集 400 億美元。OpenAI 原計(jì)劃在年底前再融資 75 億美元,但由于投資者在強(qiáng)勁增長(zhǎng)的背景下爭(zhēng)相加入其股權(quán)結(jié)構(gòu),OpenAI 最終拿到了便宜。

ChatGPT 的每周活躍用戶超過 7 億,推動(dòng)了 OpenAI 的年收入已經(jīng)接近 130 億美元,預(yù)計(jì)到年底將達(dá)到 200 億美元。此外加上美國(guó)政府的《AI Action Plan》以及與微軟的談判,這些都可能幫助這家大號(hào)初創(chuàng)公司實(shí)現(xiàn)年度凈盈利的目標(biāo)。

本輪融資是由 Dragoneer Investment Group 領(lǐng)投的,其投入金額高達(dá) 28 億美元。許多新投資者也參與了融資,包括私募股權(quán)巨頭黑石集團(tuán)和 TPG,共同基金管理公司普信(T. Rowe Price),其他參與者包括 Altimeter Capital、Andreessen Horowitz、Coatue Management、D1 Capital Partners、Fidelity Management、Founders Fund、紅杉資本、老虎環(huán)球基金和 Thrive Capital。

據(jù)稱,OpenAI 的一些早期投資者還對(duì)他們?cè)诒据喨谫Y中獲得的資金分配較少感到沮喪。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-04-13 13:38:59

2024-09-05 21:02:58

2024-12-24 14:30:00

模型AI訓(xùn)練

2025-06-27 15:48:34

2023-06-08 07:58:29

2024-03-21 14:06:50

2023-11-09 12:41:04

AI模型

2025-02-13 10:52:56

2024-01-18 12:30:03

2017-06-22 08:58:06

2023-08-02 13:52:59

GPT-5模型

2025-08-20 12:22:31

2025-06-19 09:06:00

2024-05-11 08:24:16

OpenAIAI語(yǔ)音助手人工智能

2023-09-03 12:56:43

2023-11-14 14:26:29

OpenAIGPT-5

2023-08-10 15:22:48

人工智能OpenAI

2025-10-31 15:53:06

AI模型GPT-5

2025-08-13 18:31:52

GPT-5模型AI

2023-08-11 10:44:20

GPT-5
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)