偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LLM CoT的工作原理

發(fā)布于 2024-5-17 10:47

瀏覽

0收藏

?思維鏈（CoT：Chain of Thought）常常作為增強(qiáng)大模型推理能力的利器，

但大模型推理能力的提升多大程度上來自人為任務(wù)拆解？還是額外提示的Token激發(fā)了背后更強(qiáng)大的計(jì)算？

LLM CoT的工作原理-AI.x社區(qū)

“讓我們逐步思考：Transformer語言模型中的隱藏計(jì)算”[文獻(xiàn)1] 發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象，

通過在思維鏈中添加無意義的中間Token（例如“……”）可以解決無中間Token時(shí)沒法完成的較難的兩個(gè)算法任務(wù)。

文獻(xiàn)的結(jié)論是：添加額外Token就可以增強(qiáng)大模型推理，甚至可以與Token本身內(nèi)容選擇無關(guān)。

LLM CoT的工作原理-AI.x社區(qū)

網(wǎng)友本就驚訝于著名提示詞“讓我們一步一步地想”（Let‘s think step by step）的神奇效果，

對本論文描述的“AI不依賴人類經(jīng)驗(yàn)的token內(nèi)容，隱藏自行推理”，就更覺得魔幻且擔(dān)憂。

不過筆者發(fā)現(xiàn)，斯坦福谷歌等學(xué)者的預(yù)印論文，“思維鏈?zhǔn)筎ransformer能解決內(nèi)在串行的問題”[文獻(xiàn)2]，可以非常直觀的用來解釋文獻(xiàn)1中揭示的現(xiàn)象！

LLM CoT的工作原理-AI.x社區(qū)

文獻(xiàn)2采用了類似文獻(xiàn)1中的電路復(fù)雜度分析的方法，將Transformer看作一定深度的復(fù)雜電路，分析其可以解決的問題的復(fù)雜度。

電路復(fù)雜度分析用 TC0 表示可以通過一個(gè)固定深度的電路解決的計(jì)算問題，而足夠長的思維鏈，能將Transformer的表達(dá)能力擴(kuò)展到TC0之外。

文獻(xiàn)結(jié)論：“從概念上講，CoT賦予模型執(zhí)行本質(zhì)上串行計(jì)算的能力，這是Transformer所缺乏的，尤其是在深度較低的情況下?！?/p>

意思是文獻(xiàn)1描述的“AI不依賴人類經(jīng)驗(yàn)的token內(nèi)容隱藏自行推理”，既不魔幻也不可怕，甚至可以說是Transformer內(nèi)在缺陷導(dǎo)致的。

LLM CoT的工作原理-AI.x社區(qū)

文獻(xiàn)進(jìn)一步論證，通過T步CoT，使用固定位精度和O(logn) 嵌入大小的固定深度Transformer可以解決任何可由大小為T的布爾電路解決的問題。

實(shí)證上，CoT的作用是，提高了低深度Transformer在內(nèi)在串行問題上的表達(dá)能力。

LLM CoT的工作原理-AI.x社區(qū)

筆者理解是，CoT 其實(shí)是引導(dǎo)了Transformer避免簡單并行推理，而是通過串行的方式去一步步推理。

原理很直觀，類似有向無環(huán)圖DAG的處理，例如SQL數(shù)據(jù)查詢，并不是所有的Access Plan DAG 中的算子都適合并行，有許多并行阻斷算子 parallel blocker, 例如全局sort。

這是Transformer特有的現(xiàn)象嗎？Mamba之類的潛力架構(gòu)是否可以規(guī)避這個(gè)問題，優(yōu)化zero-shot推理呢？

LLM CoT的工作原理-AI.x社區(qū)

結(jié)合筆者的大模型數(shù)理原理的認(rèn)知框架，可以這么看：LLM在范疇中采樣，變分推理時(shí)，

串行處理，引入中間信息，加深LLM在范疇對象和態(tài)射中遍歷的深度，逐步調(diào)整采樣概率分布，實(shí)現(xiàn)更精確的推理；

并行處理，增加填充信息，在寬度上有機(jī)會影響采樣的概率分布，進(jìn)而影響最后的推理效果。

文獻(xiàn)1 Let's Think Dot by Dot: Hidden Computation in Transformer Language Models https://arxiv.org/abs/2404.15758

文獻(xiàn)2 Chain of Thought Empowers Transformers to Solve Inherently Serial Problems https://arxiv.org/abs/2402.12875

本文轉(zhuǎn)載自??清熙??，作者：王慶法 ????

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

Agent四大范式 | 綜述：全面理解Agent工作原理

大語言模型論文跟蹤 ? 7826瀏覽 ? 0回復(fù)
AI Agent：人類工作范式的顛覆者還是人機(jī)協(xié)作新范式？

Baihai_IDP ? 5116瀏覽 ? 0回復(fù)
Meta AI的首席執(zhí)行官LeCun：不要從事LLM工作

51CTO技術(shù)棧 ? 2585瀏覽 ? 0回復(fù)
MiniCache 和 PyramidInfer 等 6 種優(yōu)化 LLM KV Cache 的最新工作

amei2000go ? 9687瀏覽 ? 0回復(fù)
深入剖析時(shí)序Prophet模型：工作原理與源碼解析

卓勝微wjp ? 3806瀏覽 ? 0回復(fù)
谷歌開源Gemma Scope，更好解釋大模型工作原理

Aceryt ? 3381瀏覽 ? 0回復(fù)
深度學(xué)習(xí)中生成模型的工作原理：解析用于數(shù)據(jù)增強(qiáng)的生成模型

51CTO內(nèi)容精選 ? 4032瀏覽 ? 0回復(fù)
多模態(tài)大模型的實(shí)現(xiàn)原理，以及技術(shù)難點(diǎn)

AI探索時(shí)代 ? 5666瀏覽 ? 0回復(fù)
LLM合集：港大利用GPT-4o生成QA對，打造大規(guī)模多模態(tài)視頻思維鏈（COT）數(shù)據(jù)集

AIPaperDaily ? 3216瀏覽 ? 0回復(fù)
LLM推薦系統(tǒng)時(shí)代來了？2024大廠頂會工作總結(jié)

海因斯DK ? 3953瀏覽 ? 0回復(fù)
圖文詳解：帶你讀懂 DeepSeek-R1 的核心原理

Baihai_IDP ? 5739瀏覽 ? 0回復(fù)
詳解AI代理的內(nèi)部工作機(jī)理

51CTO內(nèi)容精選 ? 2241瀏覽 ? 0回復(fù)
什么是工作流？如何創(chuàng)建和編排AI智能體工作流

數(shù)字化助推器 ? 6475瀏覽 ? 0回復(fù)
OpenAI發(fā)布CoT監(jiān)控，阻止大模型惡意行為

Aceryt ? 1907瀏覽 ? 0回復(fù)
ChatGPT | Prompt中的CoT和ReAct

周末程序猿 ? 1572瀏覽 ? 0回復(fù)
Dify從入門到高階系列一：詳解各種工作流節(jié)點(diǎn)，如何降低LLM開發(fā)門檻？

AI博物院 ? 6399瀏覽 ? 1回復(fù)
AI Agents-5 | AI工作流與代理的深度剖析：從原理到實(shí)戰(zhàn)應(yīng)用

Halo咯咯 ? 1944瀏覽 ? 0回復(fù)
【一文了解】大模型的思維鏈技術(shù)（CoT）

碼農(nóng)隨心筆記 ? 2048瀏覽 ? 0回復(fù)
Agentic CoT 架構(gòu)實(shí)現(xiàn)RAG回答準(zhǔn)確率突破94%大關(guān)

AI博物院 ? 1563瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Nature: 精度不受熱力學(xué)第二定律限制 8天前發(fā)布
Nvidia的具身推理模型還缺什么？ 2025-05-29 07:20:59發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實(shí)測：性能直逼頂尖，普通電腦本地運(yùn)行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實(shí)測：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇： Nature：最大擴(kuò)散強(qiáng)化學(xué)習(xí)

下一篇： Nature：進(jìn)化會重復(fù)發(fā)生

社區(qū)精華內(nèi)容

目錄

<cite id="euumr"><track id="euumr"></track></cite>

<cite id="euumr"><track id="euumr"></track></cite>