偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<thead id="fokor"><acronym id="fokor"></acronym></thead>

<ol id="fokor"><rt id="fokor"><wbr id="fokor"></wbr></rt></ol>

<bdo id="fokor"></bdo>

<button id="fokor"></button>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

谷歌推出全新模型，將Transformer與NAR相結(jié)合

發(fā)布于 2024-7-8 09:35

瀏覽

0收藏

Transformer架構(gòu)的出現(xiàn)極大推動(dòng)了大模型的技術(shù)創(chuàng)新，誕生出了ChatGPT、Coplit、訊飛星火、文心一言等一系列生成式AI產(chǎn)品。

雖然Transformer在自然語言理解任務(wù)上表現(xiàn)很好,但在算法推理方面有嚴(yán)重的缺陷。例如，當(dāng)面臨超出訓(xùn)練數(shù)據(jù)分布的輸入時(shí),其泛化能力會(huì)急劇下降。這主要是因?yàn)樗鼈兊淖曰貧w性質(zhì)和掩蔽注意力機(jī)制,不符合算法輸出的邏輯順序。

而神經(jīng)算法推理(NAR) 在結(jié)構(gòu)化輸入上表現(xiàn)好，能夠處理各種算法任務(wù)，并且在面對(duì)訓(xùn)練集之外的更大輸入時(shí)仍能保持完美的泛化能力。因此，谷歌DeepMind的研究人員將Transformer與NAR相結(jié)合推出了——TransNAR。

谷歌推出全新模型，將Transformer與NAR相結(jié)合-AI.x社區(qū)

NAR是一種專門處理圖結(jié)構(gòu)數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)，其算法的計(jì)算步驟被表示為圖的節(jié)點(diǎn)和邊，而節(jié)點(diǎn)之間的信息通過邊進(jìn)行傳遞和更新。這種巧妙設(shè)計(jì)使得NAR能夠自然地表達(dá)算法的邏輯流程，包括條件判斷、循環(huán)迭代等編程結(jié)構(gòu)。

在TransNAR架構(gòu)中，研究人員并沒有簡(jiǎn)單地將Transformer和NAR串聯(lián)或并聯(lián)，而是通過一種稱為跨注意力的機(jī)制進(jìn)行深度融合。

在這種機(jī)制下，Transformer的每一層都能夠接收來自NAR的節(jié)點(diǎn)和邊的嵌入信息，這些信息通過查詢、鍵和值的形式進(jìn)行交互，從而實(shí)現(xiàn)信息的流動(dòng)和整合。

谷歌推出全新模型，將Transformer與NAR相結(jié)合-AI.x社區(qū)

TransNAR的輸入主要包括文本形式的算法問題描述，以及相應(yīng)的圖表示兩大塊：首先文本輸入被送入Transformer層，通過標(biāo)準(zhǔn)的Transformer操作，如自注意力和前饋網(wǎng)絡(luò)，來生成文本的表示。

同時(shí)，圖表示被送入NAR層，通過圖神經(jīng)網(wǎng)絡(luò)的操作，如最大池化或消息傳遞，來生成圖的節(jié)點(diǎn)和邊的表示。

當(dāng)Transformer和NAR各自準(zhǔn)備好了自己的表示后，跨注意力機(jī)制開始發(fā)揮作用。

Transformer的查詢與NAR的鍵進(jìn)行匹配，通過softmax函數(shù)進(jìn)行歸一化，然后與NAR的值進(jìn)行加權(quán)求和，最終生成Transformer的輸出。這一過程在模型的每一層都會(huì)重復(fù)迭代，直到最終生成模型的輸出。

多層級(jí)訓(xùn)練策略也是TransNAR成功的關(guān)鍵之一。在預(yù)訓(xùn)練階段，NAR被獨(dú)立訓(xùn)練，以執(zhí)行CLRS-30中的算法。CLRS-30是一個(gè)包含多種算法任務(wù)的基準(zhǔn)，這些算法任務(wù)被轉(zhuǎn)換為圖表示形式，以便NAR能夠處理。

谷歌推出全新模型，將Transformer與NAR相結(jié)合-AI.x社區(qū)

通過這種方式，幫助NAR能夠?qū)W習(xí)到各種算法的內(nèi)在邏輯和計(jì)算步驟，在面對(duì)不同算法任務(wù)時(shí)，能夠展現(xiàn)出強(qiáng)大的魯棒性和泛化能力。

在微調(diào)階段，TransNAR開始接受包含文本描述和圖表示的雙重輸入。此時(shí)，Transformer部分開始發(fā)揮作用，利用預(yù)訓(xùn)練的NAR提供的節(jié)點(diǎn)嵌入信息，通過跨注意力機(jī)制來調(diào)節(jié)自身的標(biāo)記嵌入。

此外，在微調(diào)的時(shí)候Transformer的參數(shù)是可訓(xùn)練的，而NAR的參數(shù)保持凍結(jié)。這將幫助Transformer在保持NAR魯棒性的同時(shí)，學(xué)習(xí)如何將自然語言描述轉(zhuǎn)換為算法步驟，以確保模型能夠穩(wěn)定地學(xué)習(xí)和收斂。

谷歌推出全新模型，將Transformer與NAR相結(jié)合-AI.x社區(qū)

研究人員通過CLRS-Text基準(zhǔn)測(cè)試，對(duì)TransNAR綜合測(cè)試。結(jié)果顯示， TransNAR模型在多種算法任務(wù)上顯著優(yōu)于基線Transformer。

尤其是在分布外的泛化能力上，TransNAR展現(xiàn)出了超過20%的優(yōu)化改進(jìn)。這表明TransNAR能夠有效地處理訓(xùn)練數(shù)據(jù)之外的更大或更復(fù)雜的問題實(shí)例。

本文轉(zhuǎn)自 AIGC開放社區(qū) ，作者： AIGC開放社區(qū)

原文鏈接:??https://mp.weixin.qq.com/s/7Bu4On7yorBUf3QFvTeJDw??

標(biāo)簽

數(shù)據(jù)

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

谷歌推出多模態(tài)視頻模型，自動(dòng)生成豐富動(dòng)作視頻

Aceryt ? 3586瀏覽 ? 0回復(fù)
谷歌更新Transformer架構(gòu)，更節(jié)省計(jì)算資源！50%性能提升

Crystalcxt ? 3409瀏覽 ? 0回復(fù)
Transformer解碼真實(shí)場(chǎng)景！Meta推出70M參數(shù)SceneScript模型

duhorse ? 2623瀏覽 ? 0回復(fù)
傳SearchGPT將迎擊谷歌核心業(yè)務(wù)！OpenAI與金融時(shí)報(bào)新協(xié)議已定，將進(jìn)行鏈接和引用

51CTO技術(shù)棧 ? 3148瀏覽 ? 0回復(fù)
谷歌推出TransformerFAM架構(gòu)，以更低的消耗處理長(zhǎng)序列文本

Aceryt ? 2717瀏覽 ? 0回復(fù)
谷歌推出V2A，可為視頻大模型自動(dòng)匹配語音

Aceryt ? 4103瀏覽 ? 0回復(fù)
港大推出全新「會(huì)說話」的推薦系統(tǒng)大模型XRec，從黑盒預(yù)測(cè)到可解釋

duhorse ? 2803瀏覽 ? 0回復(fù)
谷歌將大模型集成在實(shí)體機(jī)器人中，能看、聽、說執(zhí)行57種任務(wù)

Aceryt ? 2756瀏覽 ? 0回復(fù)
谷歌：Transformer在音樂推薦中的實(shí)踐

Syrupup ? 2722瀏覽 ? 0回復(fù)
知識(shí)圖譜與大模型的深度結(jié)合策略剖析

玄姐聊AGI ? 4567瀏覽 ? 0回復(fù)
一種將RAG、KG、VS、TF結(jié)合增強(qiáng)領(lǐng)域LLM性能的框架

PaperAgent ? 3134瀏覽 ? 0回復(fù)
LLM合集：谷歌推出逆向思維RevThink框架，大模型零樣本性能提升13.53%

AIPaperDaily ? 3127瀏覽 ? 0回復(fù)
騰訊發(fā)布全新混元大模型Hunyuan-Large：全球最大開源Transformer模型，助力AI發(fā)展新高度

Halo咯咯 ? 2909瀏覽 ? 0回復(fù)
中山大學(xué)、美團(tuán)聯(lián)合團(tuán)隊(duì)推出行為正則化與順序策略優(yōu)化結(jié)合的離線多智能體學(xué)習(xí)算法

xuxiangda ? 2825瀏覽 ? 0回復(fù)
云計(jì)算與大模型訓(xùn)練的結(jié)合

AI探索時(shí)代 ? 2271瀏覽 ? 0回復(fù)
Voyage AI 推出 voyage-code-3：專為代碼檢索而優(yōu)化的全新下一代嵌入模型

Halo咯咯 ? 4083瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來趨勢(shì)報(bào)告

歐米伽未來研究所 ? 8558瀏覽 ? 0回復(fù)
【PaperDaily】谷歌推出AlphaGeometry2，超過金牌選手，稱霸IMO

AIPaperDaily ? 2246瀏覽 ? 0回復(fù)
谷歌推出Veo 2，生成8秒超逼真視頻

Aceryt ? 1647瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

剛剛，OpenAI發(fā)布GPT-image-1模型，更強(qiáng)吉卜力版本來啦 2025-04-24 09:57:36發(fā)布
字節(jié)跳動(dòng)開源多模態(tài)AI Agent—UI-TARS-1.5 2025-04-23 11:55:00發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測(cè)：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測(cè)：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇：中國AI大模型論文數(shù)量全球第一，清華力壓麻省理工、斯坦福

下一篇：好萊塢級(jí)視頻模型：4種混合模型，顛覆傳統(tǒng)生成方法

社區(qū)精華內(nèi)容

目錄