偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

OpenAI新模型研發(fā)遇挫,稀疏性是大模型降本的鑰匙嗎?

人工智能 新聞
知情人士稱,OpenAI 希望 Arrakis 是一個(gè)與 GPT-4 性能相當(dāng),且運(yùn)行效率更高的模型。Arrakis 模型用到的關(guān)鍵方法是利用稀疏性。

大模型的訓(xùn)練與運(yùn)行成本極其高昂,OpenAI 也嘗試過(guò)降低成本,只可惜失敗了。

去年年底,當(dāng) ChatGPT 引起全球轟動(dòng)時(shí),OpenAI 的工程師開始研究一種新的人工智能模型,代號(hào)為 Arrakis。Arrakis 旨在讓 OpenAI 能夠以更低的成本運(yùn)行聊天機(jī)器人。 

但據(jù)知情人士透露:2023 年年中,OpenAI 已經(jīng)取消了 Arrakis 的發(fā)布,因?yàn)樵撃P偷倪\(yùn)行效率沒有公司預(yù)期的那么高。

這次失敗意味著 OpenAI 失去了寶貴的時(shí)間,并需要將資源轉(zhuǎn)移到開發(fā)不同的模型上。

對(duì)合作投資來(lái)說(shuō),Arrakis 的研發(fā)計(jì)劃對(duì)于兩家公司完成 100 億美元投資和產(chǎn)品交易的談判非常有價(jià)值。據(jù)一位知情的微軟員工透露,Arrakis 的失敗讓微軟的一些高管感到失望。

更重要的是,Arrakis 的失敗預(yù)示著人工智能的未來(lái)發(fā)展可能會(huì)充滿難以預(yù)測(cè)的陷阱。

Arrakis 是個(gè)什么樣的模型?

知情人士稱,OpenAI 希望 Arrakis 是一個(gè)與 GPT-4 性能相當(dāng),且運(yùn)行效率更高的模型。Arrakis 模型用到的關(guān)鍵方法是利用稀疏性。

稀疏性是谷歌等其他人工智能開發(fā)商也公開討論并使用的機(jī)器學(xué)習(xí)概念。谷歌高管 Jeff Dean 曾表示:「稀疏計(jì)算將成為未來(lái)的一個(gè)重要趨勢(shì)?!?/span>

OpenAI 很早就開始了關(guān)于稀疏性的研究,早在 2017 年他們就推出了稀疏計(jì)算內(nèi)核。Arrakis 本來(lái)可以讓 OpenAI 更廣泛地推廣其技術(shù),因?yàn)樵摴究梢允褂脭?shù)量有限的專用服務(wù)器芯片來(lái)為其軟件提供支持。

當(dāng)前,增加稀疏性的一種常見方法是借助「混合專家系統(tǒng)(MoE)」技術(shù)。然而,加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授 Ion Stoica 曾表示:「一般來(lái)說(shuō),專家模型的數(shù)量越多,模型就越稀疏,效率也越高,但可能會(huì)導(dǎo)致模型生成的結(jié)果不太準(zhǔn)確。」

大約在今年春天,OpenAI 的研究人員開始訓(xùn)練 Arrakis 模型,其中涉及使用先進(jìn)的計(jì)算硬件來(lái)幫助模型處理大量數(shù)據(jù)。知情人士稱,該公司預(yù)計(jì)訓(xùn)練 Arrakis 比訓(xùn)練 GPT-4 要便宜得多。然而,研究團(tuán)隊(duì)很快就意識(shí)到該模型的表現(xiàn)不夠好,無(wú)法獲得預(yù)期的增益。研究團(tuán)隊(duì)花了大約一個(gè)月的時(shí)間試圖解決問題后,OpenAI 的高層領(lǐng)導(dǎo)決定停止訓(xùn)練該模型。

值得欣慰的是,OpenAI 可以將其在 Arrakis 上的工作整合到其他模型中,例如即將推出的多模態(tài)大模型 Gobi。

兩位知情人士表示,Arrakis 的表現(xiàn)之所以低于 OpenAI 的預(yù)期,是因?yàn)樵摴驹噲D提高模型的稀疏性,這意味著將只使用模型的一部分來(lái)生成響應(yīng),從而降低運(yùn)行成本。該模型在早期測(cè)試中有效但后來(lái)表現(xiàn)不佳的原因尚不清楚。

值得一提的是,有知情人士稱 OpenAI 曾為 Arrakis 考慮的公開名稱是 GPT-4 Turbo。

降低成本有多重要?

對(duì)于 OpenAI 來(lái)說(shuō),隨著人們對(duì)技術(shù)成本的擔(dān)憂日益增加以及開源替代方案的激增,使其模型更便宜、更高效是首要任務(wù)。

據(jù)知情人士稱,微軟使用 OpenAI 的 GPT 模型為 Office 365 應(yīng)用程序和其他服務(wù)中的人工智能功能提供支持,并且微軟原本預(yù)計(jì) Arrakis 能夠提高這些功能的性能并降低成本。

與此同時(shí),微軟開始研發(fā)自己的 LLM,并且其 LLM 的運(yùn)行成本可能比 OpenAI 的模型更低。

盡管這場(chǎng)挫折并沒有減緩 OpenAI 今年的業(yè)務(wù)發(fā)展,但隨著 LLM 領(lǐng)域的競(jìng)爭(zhēng)日益加劇,特別是谷歌、微軟等科技巨頭的加速研發(fā),OpenAI 也有可能在這條賽道上式微。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2024-02-19 14:14:02

云計(jì)算人工智能大語(yǔ)言模型

2024-07-19 09:26:12

2023-05-17 10:05:56

2024-05-10 12:58:08

2025-04-30 16:48:07

2023-09-12 07:02:19

騰訊混元大模型

2024-10-10 14:10:00

AI模型

2025-05-30 05:00:00

AI模型數(shù)據(jù)訓(xùn)練

2023-10-11 12:32:53

AI模型

2025-04-24 08:29:59

OpenAIGPT-4.1人工智能

2025-06-09 09:32:35

2024-11-13 14:37:30

2025-07-03 09:31:52

2024-01-29 00:05:00

OpenAI嵌入機(jī)器學(xué)習(xí)

2025-01-23 10:45:52

2024-10-05 00:00:00

2023-03-06 15:24:54

谷歌人才

2023-08-30 13:23:00

模型訓(xùn)練

2024-11-14 14:20:00

生成式AI數(shù)據(jù)

2023-12-29 13:45:57

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)