偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

為什么讓模型"一步步思考"能顯著提升推理能力？

發(fā)布于 2025-8-14 08:15

瀏覽

0收藏

最近，國內(nèi)大學有一項研究《How Chain-of-Thought Works? Tracing Information Flow from Decoding, Projection, and Activation》回答了一個困擾AI研究者很久的問題：為什么讓模型"一步步思考"會顯著提升推理能力？它們拆解了Chain-of-Thought（思維鏈）提示的內(nèi)部機制。過去大家都知道它有效，但沒人說得清楚具體原因。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

研究團隊選了6個不同規(guī)模的模型（LLaMA3.2-3B，LLaMA3.1 (8B, 70B)，Gemma2 (2B, 9B, 27B) ），在9個數(shù)據(jù)集上做了全面測試，涵蓋算術推理、常識推理和符號推理。重點是，他們從解碼、概率投影和神經(jīng)元激活的過程中的信息流動分析了CoT的內(nèi)部機制。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

核心發(fā)現(xiàn)

1. CoT本質(zhì)是結(jié)構(gòu)化剪枝器

研究發(fā)現(xiàn)CoT并非什么神奇的推理能力，而是通過模板匹配來約束輸出空間。當你說"讓我們一步步分析"時，模型實際上在執(zhí)行一套精巧的模仿策略：從提示中學習結(jié)構(gòu)性關鍵詞，從問題中提取具體內(nèi)容，然后按照固定的推理模板生成答案。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

論文量化了這種"模仿"程度，發(fā)現(xiàn)結(jié)構(gòu)遵循度與準確率呈強正相關，準確率可從0.3提升到0.9。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

有趣的是，模型對不同類型關鍵詞的模仿策略截然不同：時間和動作詞匯主要從CoT提示中學習，數(shù)字關鍵詞則主要從輸入問題中提取。而在需要常識推理的任務中，模型對問題關鍵詞的模仿顯著降低，因為它需要更多依賴內(nèi)部知識。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

2. 概率分布的收斂效應

通過分析概率分布，研究者發(fā)現(xiàn)了CoT提升性能的核心機制：它讓模型的選擇變得更加確定，就像一個漏斗，把生成下一個詞的概率集中到正確的詞上。這樣正確答案的不確定性可以降低50-80%，CoT生成的概率分布更加集中，密度峰值提升了數(shù)倍，熵更低。這解釋了為什么CoT能提高準確性——不是推理變強了，而是選擇變準了。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

3. 與任務相關的神經(jīng)元激活

最令人意外的發(fā)現(xiàn)是CoT對神經(jīng)元激活的影響完全取決于任務類型。在開放域任務（如數(shù)學題）中，CoT會減少約4%的神經(jīng)元激活，主要影響網(wǎng)絡后三分之一的層次，像"剪枝器"一樣聚焦相關特征。但在封閉域任務（如選擇題）中，情況完全相反：CoT會增加3-5%的神經(jīng)元激活，更全面地評估各種選項，像"放大器"一樣增強判別能力。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

性能提升顯著

這種機制帶來的性能提升是顯著的：數(shù)學推理任務的準確率提升了200-300%，選擇題任務提升25-60%，符號推理任務提升超過100%。所有測試模型都顯示出相同的機制模式，證明這些發(fā)現(xiàn)具有普遍性。

為什么讓模型"一步步思考"能顯著提升推理能力？-AI.x社區(qū)

實際應用啟示

這些發(fā)現(xiàn)對提示工程有重要指導意義：

結(jié)構(gòu)比內(nèi)容更重要：與其糾結(jié)推理步驟的邏輯正確性，不如確保格式的一致性
模板遷移有效：相似結(jié)構(gòu)的CoT提示可以跨任務使用，關鍵是保持推理模板的完整性
任務匹配很關鍵：開放性問題用引導收斂的提示，選擇性問題用鼓勵全面考慮的提示z

小結(jié)

論文也指出，在LLM這個"黑箱"中建立因果鏈條極其困難。他們的發(fā)現(xiàn)更多是"強相關"而非"確定因果"，這樣的的結(jié)論構(gòu)建在實證分析而非原理推演。但無論如何，它用實測數(shù)據(jù)揭示了CoT的可能工作原理：它通過結(jié)構(gòu)化模板引導、token生成概率分布收斂和任務相關的神經(jīng)元激活，將模型的"猜測"變成"有根據(jù)的推斷"。

它不是在模擬人類推理，而是在執(zhí)行一套精巧的概率優(yōu)化策略。理解這一點，或許能幫我們設計出更有效的提示，更好的發(fā)揮LLM的能力。

論文：https://arxiv.org/pdf/2507.20758

本文轉(zhuǎn)載自????????AI工程化????????，作者：ully

標簽

結(jié)構(gòu)化

贊

收藏

回復

舉報

回復

相關推薦

只需一步！One-Step圖像轉(zhuǎn)換來了！親測效果驚艷！

angel ? 6494瀏覽 ? 0回復
生成式視頻的下一步是什么

lintoms ? 3830瀏覽 ? 0回復
Google總監(jiān)提出生成式AI應用架構(gòu)和成熟度模型，一步步指導進階

Syrupup ? 7195瀏覽 ? 0回復
RAPTOR 檢索樹再次進一步提升RAG性能的設計思路

AIGC觀察者 ? 5750瀏覽 ? 0回復
如何確保Agent系統(tǒng)每一步都符合預期？

探索AGI ? 8619瀏覽 ? 1回復
LlamaIndex結(jié)合DSPy，進一步優(yōu)化RAG系統(tǒng)

小虎哦哦 ? 4325瀏覽 ? 0回復
StaR ｜用少量推理數(shù)據(jù)讓模型學會通用推理能力，顯著提升模型復雜推理

arnoldzhw ? 5182瀏覽 ? 0回復
使用MCTS顯著提升LLM在復雜任務的推理能力

arnoldzhw ? 9374瀏覽 ? 0回復
多Agent思想顯著提升小模型工具調(diào)用能力

arnoldzhw ? 4882瀏覽 ? 0回復
讓 ChatGPT 自動執(zhí)行你的想法，向代理時代邁出的小小一步！

老蛀蟲 ? 4505瀏覽 ? 0回復
只需一步！上交&哈佛提出FluxSR：首個基于12B+大模型的單步擴散真實世界超分模型

angel ? 5169瀏覽 ? 0回復
如何高效轉(zhuǎn)換PDF為Markdown：構(gòu)建優(yōu)質(zhì)Graph RAG的第一步

Halo咯咯 ? 3826瀏覽 ? 0回復
業(yè)界首個“混合AI推理模型”！快OpenAI一步Anthropic跳版本發(fā)布：Claude3.7 Sonnet可自行決定思考時長

51CTO技術棧 ? 3056瀏覽 ? 0回復
利用LLM做論文review到哪一步了？來看看DeepReview吧！

arnoldzhw ? 5109瀏覽 ? 0回復
這個AI系統(tǒng)能給你的每一步解題過程打分

sbf_2000 ? 3213瀏覽 ? 0回復
手把手帶你看懂自注意力機制：三個輸入一步步算到底

人工智能訓練營 ? 2375瀏覽 ? 0回復
一步步帶你用LoRA微調(diào)大模型-執(zhí)行篇

碼農(nóng)隨心筆記 ? 2306瀏覽 ? 0回復
快手端到端生成式搜索框架OneSearch，讓搜索“一步到位”！

快手技術 ? 2092瀏覽 ? 0回復
LMCache+VLLM實戰(zhàn)指南，讓大模型的推理速度顯著提升！

AI小新 ? 2217瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Glyph：文本轉(zhuǎn)圖片解決長上下文困境，智譜把“DeepSeek-OCR”具像化了 3天前發(fā)布
LangChain提出Agent工程化的新分層（Agent harness） 3天前發(fā)布

熱門推薦

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術架構(gòu)全解析 0回復

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復

DeepSeek團隊開源新模型DeepSeek-OCR，用3B參數(shù)量實現(xiàn)10倍文本壓縮的多模態(tài)突破 0回復

上一篇：上下文管理：從Agent失效到高效運行的完整指南

下一篇： Google發(fā)布"Nano Banana"圖像生成模型，號稱全球第一

社區(qū)精華內(nèi)容

目錄

<meter id="yurzx"></meter>

<button id="yurzx"></button>

<del id="yurzx"><option id="yurzx"><table id="yurzx"></table></option></del>

<table id="yurzx"><strong id="yurzx"></strong></table>