偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

刷新世界記錄!40B模型+20萬億token,散戶組團(tuán)挑戰(zhàn)算力霸權(quán)

人工智能
全球網(wǎng)友用閑置顯卡組團(tuán)訓(xùn)練大模型。40B大模型、20萬億token,創(chuàng)下了互聯(lián)網(wǎng)上最大規(guī)模的預(yù)訓(xùn)練新紀(jì)錄!去中心化AI的反攻,正式開始。OpenAI等巨頭的算力霸權(quán),這次真要涼了?

互聯(lián)網(wǎng)上最大規(guī)模的預(yù)訓(xùn)練來了!

Nous Research宣布正式推出Psyche網(wǎng)絡(luò)(Psyche Network),通過去中心化方式革新人工智能(AI)訓(xùn)練。

圖片

Psyche網(wǎng)絡(luò)利用區(qū)塊鏈技術(shù),匯聚全球計(jì)算資源,成功啟動(dòng)了40B參數(shù)大語言模型Consilience的預(yù)訓(xùn)練任務(wù),總計(jì)20萬億token,創(chuàng)下了迄今為止互聯(lián)網(wǎng)上最大規(guī)模的預(yù)訓(xùn)練紀(jì)錄。

大語言模型Consilience采用DeepSeek V3的多頭潛在注意力(MLA)架構(gòu),相較于Llama使用的GQA架構(gòu)更具表達(dá)力,同時(shí)通過優(yōu)化QKV投影矩陣減少計(jì)算開銷。

三種注意力的對比三種注意力的對比

Psyche利用全球閑置的計(jì)算資源(如4090、A100和H100等消費(fèi)級GPU),大幅降低訓(xùn)練成本。

通過并行實(shí)驗(yàn),Psyche鼓勵(lì)開源社區(qū)提出新的模型架構(gòu)和訓(xùn)練方法,未來可能催生更多創(chuàng)新。

Psyche網(wǎng)絡(luò)技術(shù)原理圖,核心在于DisTrO優(yōu)化器與Solana區(qū)塊鏈Psyche網(wǎng)絡(luò)技術(shù)原理圖,核心在于DisTrO優(yōu)化器與Solana區(qū)塊鏈

過去,人們總覺得「AI模型的去中心化訓(xùn)練」不過是一種幻想,尤其在那些超越了愛好者規(guī)模的語言模型面前更是如此。

但幾項(xiàng)關(guān)鍵技術(shù)突破——尤其是并行化和強(qiáng)化學(xué)習(xí)——正在逐漸打破這種局限,讓除了OpenAI、Anthropic這類大公司之外的小型團(tuán)隊(duì)也開始進(jìn)入這個(gè)賽道。

圖片

現(xiàn)在看來,聰明的算法可以彌補(bǔ)基礎(chǔ)設(shè)施的不足,而像Nous Research這樣的去中心化參與者正希望抓住這個(gè)機(jī)會。

砸碎算力墻

近年來,AI模型的訓(xùn)練逐漸被大型科技公司壟斷。

訓(xùn)練一個(gè)前沿模型需要數(shù)千個(gè)高性能GPU和超高帶寬的集群,這使得普通研究者或小型團(tuán)隊(duì)幾乎無法參與。

這種集中化趨勢不僅限制了創(chuàng)新,還可能導(dǎo)致少數(shù)科技去投壟斷甚至控制AI模型。

集中式AI,可能會少數(shù)科技巨頭「比你更了解你自己」。

Hermes系列中規(guī)模最大的模型——Hermes 3 405B,是在基礎(chǔ)的Llama 3.1模型上進(jìn)行微調(diào)完成的。

整個(gè)訓(xùn)練過程動(dòng)用了128塊H100 GPU,耗時(shí)約16小時(shí)(總計(jì)約2,086GPU小時(shí))。

從成本上看其實(shí)并不離譜——目前租用8塊H100的計(jì)算節(jié)點(diǎn)每小時(shí)大約在16到24美元之間,因此一次完整訓(xùn)練的開銷大約在5,000美元左右。

圖片圖片

作為Nous Research Hermes系列的最新迭代,Hermes 3 405B自Llama-3.1 405B的全參數(shù)微調(diào)模型,

但如果我們想更進(jìn)一步,想得更大呢?

圖片圖片

畢竟,Hermes目前還是依賴Llama作為基礎(chǔ)模型。

如果我們不再依賴已有的模型,而是從零開始構(gòu)建自己的基礎(chǔ)模型,那我們就需要更龐大的“船”了。

要以更大規(guī)模、低成本地實(shí)現(xiàn)類似的訓(xùn)練成果,確實(shí)面臨不少挑戰(zhàn),尤其是當(dāng)訓(xùn)練從集中化的GPU集群轉(zhuǎn)向基于互聯(lián)網(wǎng)的去中心化網(wǎng)絡(luò)時(shí)。

Nous Research提出了Psyche網(wǎng)絡(luò)的解決方案:通過去中心化的方式,讓全球的計(jì)算資源參與AI模型訓(xùn)練,降低進(jìn)入門檻,推動(dòng)AI發(fā)展的民主化。

圖片圖片

Nous Research的Psyche網(wǎng)絡(luò)成功實(shí)現(xiàn)了去中心化的AI訓(xùn)練,開創(chuàng)了一個(gè)全新的模式。

Psyche不僅降低了AI開發(fā)的門檻,還推動(dòng)了全球協(xié)作和創(chuàng)新。

Consilience模型的預(yù)訓(xùn)練只是起點(diǎn),未來Psyche網(wǎng)絡(luò)有望成為AI民主化的重要基石,為開源社區(qū)和小型團(tuán)隊(duì)提供與科技巨頭抗衡的機(jī)會。

用DisTrO解決帶寬瓶頸

在去中心化訓(xùn)練中,網(wǎng)絡(luò)帶寬一直是最令人擔(dān)憂的問題之一。

在傳統(tǒng)的數(shù)據(jù)中心里,GPU之間通過極高帶寬的連接(如NVLink或InfiniBand)相連,帶寬可達(dá)每秒幾百Gb(千兆位)。

而相比之下,互聯(lián)網(wǎng)上的志愿者節(jié)點(diǎn),往往只有幾十甚至幾百M(fèi)b(兆位)每秒的帶寬。

質(zhì)疑者認(rèn)為,這種高達(dá)100倍甚至1,000倍的帶寬差距,會讓跨互聯(lián)網(wǎng)的AI訓(xùn)練變得無比緩慢、幾乎不可能。

畢竟,傳統(tǒng)的訓(xùn)練方式需要GPU之間持續(xù)地交換更新信息,而如果試圖用普通家用網(wǎng)絡(luò)來完成這些通信,很可能會陷入「災(zāi)難級」的訓(xùn)練體驗(yàn)。

在此前對DeMo(Decoupled Momentum Optimization)的研究基礎(chǔ)上,Nous推出的DisTrO技術(shù),能夠讓所有訓(xùn)練節(jié)點(diǎn)保持高度同步,同時(shí)將所需帶寬降低1,000到10,000倍。

圖片圖片

2024年12月,Nous與多位合作伙伴一起,在封閉測試網(wǎng)中,訓(xùn)練了一個(gè)150億參數(shù)的基礎(chǔ)模型,并成功驗(yàn)證了多項(xiàng)理論設(shè)想:

  • 首次將DisTrO優(yōu)化器系列大規(guī)模應(yīng)用于訓(xùn)練任務(wù)
  • 驗(yàn)證了節(jié)點(diǎn)中途掉線和新增節(jié)點(diǎn)時(shí)的容錯(cuò)能力
  • 證明了增加訓(xùn)練節(jié)點(diǎn)確實(shí)能提升整體訓(xùn)練速度

這次實(shí)驗(yàn)標(biāo)志著分布式、去中心化訓(xùn)練邁出了從理論走向現(xiàn)實(shí)的關(guān)鍵一步。

圖片

區(qū)塊鏈+AI

在硅谷的一些圈子里,「加密」這個(gè)詞幾乎成了貶義詞,而Nous一直努力保持與AI開發(fā)者之間的開放交流橋梁不被切斷。

也正因如此,他們這次將Psyche搭建在區(qū)塊鏈上,是一個(gè)值得關(guān)注的重要轉(zhuǎn)變。

Psyche將成為Nous用于預(yù)訓(xùn)練、微調(diào)和部署下一代模型的平臺。

通過將技術(shù)棧遷移到Solana區(qū)塊鏈,Nous希望釋放區(qū)塊鏈的以下三大優(yōu)勢:

  • 無需許可:任何人都可以貢獻(xiàn)計(jì)算資源
  • 彈性與高可用性:不再依賴中心化基礎(chǔ)設(shè)施
  • 激勵(lì)機(jī)制:協(xié)調(diào)并獎(jiǎng)勵(lì)為網(wǎng)絡(luò)作出貢獻(xiàn)的參與者

將這一協(xié)議向整個(gè)市場開放,意味著任何人都能擁有其中的一部分。而其潛在的擴(kuò)展性之大,顯然已經(jīng)讓不少極客興奮不已。

計(jì)劃概覽

Nous的初期目標(biāo)是先上線一個(gè)封閉測試網(wǎng)(Phase 0),驗(yàn)證是否能在Solana上運(yùn)行一個(gè)更大規(guī)模、分布式、具備容錯(cuò)能力的DisTrO系統(tǒng)。后續(xù)階段會逐步引入更高級的功能。

在Phase 0階段,貢獻(xiàn)者可以攜帶自己的GPU加入進(jìn)來(明確提到支持4090、A100和H100等型號),并開始獲得獎(jiǎng)勵(lì)。此階段會對參與者進(jìn)行篩選,以防止惡意行為者加入。

圖片圖片

一旦系統(tǒng)穩(wěn)定運(yùn)行,權(quán)限將逐步開放,允許不同類型的計(jì)算資源(無論是專業(yè)的還是消費(fèi)級的)自由接入網(wǎng)絡(luò),協(xié)助訓(xùn)練Llama、Diffusion等不同類型的模型架構(gòu)。

圖片圖片

強(qiáng)化學(xué)習(xí)后訓(xùn)練階段

強(qiáng)化學(xué)習(xí)(Reinforcement Learning,RL)不依賴于預(yù)先準(zhǔn)備好的數(shù)據(jù)集,而是通過模型與環(huán)境直接互動(dòng)來學(xué)習(xí)。

每個(gè)節(jié)點(diǎn)如果做出有助于模型進(jìn)化的行為,就會獲得正反饋,反之則獲得負(fù)反饋。

由于這些節(jié)點(diǎn)可以異步運(yùn)行,分布式訓(xùn)練在強(qiáng)化學(xué)習(xí)框架下反而運(yùn)行良好。

每個(gè)節(jié)點(diǎn)可以獨(dú)立行動(dòng),收集經(jīng)驗(yàn),并定期與其他節(jié)點(diǎn)分享進(jìn)展。

這極大緩解了傳統(tǒng)訓(xùn)練中常見的「同步難題」,特別是在硬件能力和網(wǎng)絡(luò)延遲差異大的情況下。

通過RL,Psyche上的預(yù)訓(xùn)練模型可以進(jìn)一步學(xué)會推理能力和領(lǐng)域知識。

而每個(gè)Psyche節(jié)點(diǎn)在訓(xùn)練過程中的表現(xiàn)都將影響它的獎(jiǎng)勵(lì):計(jì)算能力更強(qiáng)或使用了更先進(jìn)訓(xùn)練方法的節(jié)點(diǎn),可能會獲得更多代幣激勵(lì)。

圖片圖片

區(qū)塊鏈:回歸初心

在常常被斥為「過度炒作又頻頻令人失望」的區(qū)塊鏈生態(tài)中,能看到真正的創(chuàng)新成果,確實(shí)令人欣慰——簡直讓人「冷漠的靈魂也重新燃起了熱情」。

這一切,真的令人感到振奮。

Nous并不是一開始就擁抱區(qū)塊鏈技術(shù)的,相反,他們幾乎是被「拖著、踢著、喊著」走上了這條路——

但原因很簡單:區(qū)塊鏈確實(shí)是解決他們問題最合適的工具。

他們需要一種方式,不論對方來自哪里,都能吸引計(jì)算資源與人才并進(jìn)行公平支付;區(qū)塊鏈,在這一點(diǎn)上表現(xiàn)得無比出色。

他們需要一種手段,能夠協(xié)調(diào)并擴(kuò)展大規(guī)模訓(xùn)練任務(wù);而協(xié)調(diào)與擴(kuò)展,正是區(qū)塊鏈技術(shù)的「第二天性」。

他們還需要一種不受停電、封禁、宕機(jī)等影響的托管機(jī)制,能讓項(xiàng)目「打不死」、無法被關(guān)閉;在這方面,區(qū)塊鏈(這次不再是諷刺)也的確提供了最可靠的保障。

而最值得欣慰的是:這一次,人們選擇區(qū)塊鏈,不是出于投機(jī)炒作,而是出于對實(shí)際問題的認(rèn)真思考與真實(shí)需求的回應(yīng)。

如果Psyche成功了,它不僅將證明去中心化訓(xùn)練是切實(shí)可行的,更是回歸初心:為取代的集中化計(jì)算,提供了強(qiáng)有力的工具。

參考資料:

https://x.com/NousResearch/status/1922744483571171605

https://nousresearch.com/nous-psyche/

https://x.com/563defi/status/1909976170990313594

責(zé)任編輯:武曉燕 來源: 新智元
相關(guān)推薦

2013-12-09 18:14:14

2011-06-10 10:26:18

2023-09-25 07:31:19

算力AI框架

2017-03-03 15:40:09

人工智能

2018-08-03 16:09:42

搜狗

2023-04-20 18:17:33

計(jì)算

2024-05-20 08:50:00

模型神經(jīng)網(wǎng)絡(luò)

2025-06-11 09:06:00

AI架構(gòu)算力

2021-03-17 15:12:57

AI 數(shù)據(jù)人工智能

2025-06-12 09:37:30

2014-11-19 18:05:33

eLTE華為eLTE聯(lián)盟

2021-09-15 15:00:25

數(shù)字經(jīng)濟(jì)科技革命產(chǎn)業(yè)變革

2010-10-16 16:26:48

WiMAX

2024-03-11 08:50:00

高溫超導(dǎo)技術(shù)

2017-03-27 16:15:42

ChromeVivaldi瀏覽器

2024-01-29 07:50:00

AI視頻

2022-05-05 11:17:55

人工智能AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號