偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<center id="lapbc"></center>

<tr id="lapbc"><sup id="lapbc"></sup></tr>

<ruby id="lapbc"><samp id="lapbc"><form id="lapbc"></form></samp></ruby>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) 原創(chuàng) 精華

發(fā)布于 2024-8-12 07:23

瀏覽

0收藏

0、背景

Transformer 大模型，一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)，已被廣泛應(yīng)用于各種自然語言處理任務(wù)，比如：機(jī)器翻譯、文本摘要、生成問答等。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

從端到端的角度來看，Transformer 大模型中數(shù)據(jù)的處理流程主要包括四個階段：首先是嵌入階段（Embedding），隨后是注意力機(jī)制階段（Attention），然后是通過多層感知機(jī)（MLPs）進(jìn)行處理，最后是從模型的表示轉(zhuǎn)換到最終輸出的解嵌入階段（Unembedding），如下圖所示：

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

圖：Embedding -> Attention -> MLPs -> Unembedding

下面是對這四個階段的簡要介紹。

1、Embedding（嵌入）階段

大模型的輸入通常由離散的詞匯或符號組成（比如：在英文文本中，每個單詞或標(biāo)點(diǎn)符號都是一個單獨(dú)的符號）。嵌入層的作用是將這些離散的符號轉(zhuǎn)換成連續(xù)的、具有固定維度的向量（通常稱為詞嵌入）。這些向量能夠捕獲符號的語義以及上下文信息。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

在Transformer 大模型中，無論是編碼器（Encoder）還是解碼器（Decoder），都包含一個嵌入層。此外，在解碼器中，還會添加一個位置嵌入（Positional Embedding）層，用于記錄序列中單詞的位置信息，這是因為 Transformer 大模型不通過 RNN 或 CNN 等傳統(tǒng)結(jié)構(gòu)來直接捕捉序列的順序信息。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

2、Attention （注意力機(jī)制）階段

注意力機(jī)制構(gòu)成了 Transformer 大模型的基石，它使得大模型能夠在產(chǎn)生當(dāng)前輸出時聚焦于輸入序列中的各個部分。Transformer 大模型采用了多種類型的注意力機(jī)制，其中包括自注意力（Self-Attention）、編碼器-解碼器注意力（Encoder-Decoder Attention）以及掩碼多頭注意力（Masked Multi-Head Attention）。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

自注意力機(jī)制使得大模型能夠識別序列內(nèi)不同位置之間的相互關(guān)系，進(jìn)而把握序列的內(nèi)在結(jié)構(gòu)。編碼器-解碼器注意力機(jī)制則使得大模型在輸出生成過程中能夠針對輸入序列的特定部分給予關(guān)注。在注意力機(jī)制的運(yùn)算過程中，會生成一個注意力權(quán)重矩陣，該矩陣揭示了輸入序列中每個位置對于當(dāng)前位置的貢獻(xiàn)程度。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

3、MLPs（多層感知機(jī)，也稱為前饋神經(jīng)網(wǎng)絡(luò)）階段

在注意力機(jī)制處理之后，大模型會利用一個或多個全連接層（也稱為前饋網(wǎng)絡(luò)或 MLPs）來進(jìn)行更深層次的變換和特征提取。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

這些全連接層能夠捕捉輸入數(shù)據(jù)中的非線性關(guān)系，并輔助模型識別更復(fù)雜的模式。在 Transformer 大模型中，MLPs 一般被置于自注意力層和歸一化層之間，共同構(gòu)成了所謂的“編碼器塊”或“解碼器塊”。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

4、Unembedding（從模型表示到最終輸出）階段

這一過程可以被視作從大模型的內(nèi)部表示到最終輸出格式的轉(zhuǎn)換。

在文本生成任務(wù)中，比如：機(jī)器翻譯，解碼器的輸出將通過一個線性層和一個 Softmax 函數(shù)，以產(chǎn)生一個概率分布，該分布反映了下一個輸出詞（token）的概率。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

而在其他類型的任務(wù)中，比如：文本分類，解碼器的輸出可能直接用于損失函數(shù)的計算（比如：交叉熵?fù)p失），或者通過其他方法轉(zhuǎn)換成最終的預(yù)測結(jié)果。

Transformer 動畫揭秘：數(shù)據(jù)處理的四大關(guān)鍵技術(shù) -AI.x社區(qū)

本文轉(zhuǎn)載自公眾號玄姐聊AGI 作者：玄姐

原文鏈接：????https://mp.weixin.qq.com/s/wY5WtAlqHNPQN7LbAS9c8g??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

張俊林：揭去神秘面紗，Sora關(guān)鍵技術(shù)逆向工程圖解

mb5f8eba9bdb0af ? 6979瀏覽 ? 0回復(fù)
三大關(guān)鍵技術(shù)看RAG如何提升LLM的能力

angel ? 8190瀏覽 ? 0回復(fù)
Advanced RAG 07：在 RAG 系統(tǒng)中進(jìn)行表格數(shù)據(jù)處理的新思路

Baihai_IDP ? 5841瀏覽 ? 0回復(fù)
Agent四大范式 | 綜述：全面理解Agent工作原理

大語言模型論文跟蹤 ? 7865瀏覽 ? 0回復(fù)
計算機(jī)視覺關(guān)鍵技術(shù)

mb66125a723d24d ? 2748瀏覽 ? 0回復(fù)
AI大模型技術(shù)的四大核心架構(gòu)演進(jìn)之路

AIGC觀察者 ? 3913瀏覽 ? 0回復(fù)
2024年云中AI工程的三大關(guān)鍵趨勢

51CTO技術(shù)棧 ? 2936瀏覽 ? 0回復(fù)
RAG 開發(fā)四大痛點(diǎn)及解決方案

玄姐聊AGI ? 3198瀏覽 ? 0回復(fù)
時序預(yù)測數(shù)據(jù)處理新方法匯總：多粒度和頻域的可逆歸一化

海因斯DK ? 4480瀏覽 ? 0回復(fù)
AI應(yīng)用落地關(guān)鍵技術(shù)：AI Agent

玄姐聊AGI ? 2649瀏覽 ? 0回復(fù)
LLM 分布式訓(xùn)練六大關(guān)鍵技術(shù)介紹

Baihai_IDP ? 3102瀏覽 ? 0回復(fù)
LangChain實戰(zhàn) | Tool Calling ：讓AI真正動起來的關(guān)鍵技術(shù)

AI取經(jīng)路 ? 4252瀏覽 ? 0回復(fù)
分布式框架下的數(shù)據(jù)處理與模型推理實踐

zhcs333 ? 3603瀏覽 ? 0回復(fù)
2025 AI Infra展望：重塑基礎(chǔ)設(shè)施的四大關(guān)鍵趨勢

唐克 ? 3569瀏覽 ? 0回復(fù)
神經(jīng)網(wǎng)絡(luò)的兩個重難點(diǎn)之一，數(shù)據(jù)處理和模型設(shè)計

AI探索時代 ? 1636瀏覽 ? 0回復(fù)
2025年HPC-AI市場展望：五大關(guān)鍵問題的剖析

chengganfei ? 1848瀏覽 ? 0回復(fù)
Dify Sandbox實現(xiàn)文件路徑獲取與Excel數(shù)據(jù)處理

九歌AI大模型 ? 2945瀏覽 ? 0回復(fù)
從零到一構(gòu)建Agent系統(tǒng)：四大模塊 + 框架生態(tài)詳解

PyTorch研習(xí)社 ? 2782瀏覽 ? 0回復(fù)
AI 智能體架構(gòu)設(shè)計三階段演進(jìn)和三大關(guān)鍵技術(shù)對比剖析

玄姐聊AGI ? 1330瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

AI 智能體 ReAct 架構(gòu)設(shè)計模式剖析 2天前發(fā)布
九種 MCP 架構(gòu)設(shè)計模式剖析 2天前發(fā)布

熱門推薦

一文搞定 AI 智能體架構(gòu)設(shè)計的九大核心技術(shù) 0回復(fù)

性能提升90%，Anthropic 首次公開多智能體架構(gòu)構(gòu)建全流程 0回復(fù)

AI 智能體架構(gòu)設(shè)計三階段演進(jìn)和三大關(guān)鍵技術(shù)對比剖析 0回復(fù)

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

上一篇：一文徹底理解大模型 Agent 智能體原理和案例

下一篇：一個更小、更快、更干凈的 GraphRAG??！

社區(qū)精華內(nèi)容

目錄