偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

推理大模型并非一定要推理

發(fā)布于 2025-4-23 07:14

瀏覽

0收藏

論文筆記分享， Reasoning Models Can Be Effective Without Thinking。 uc berkeley。

推理大模型并非一定要推理-AI.x社區(qū)

目前主流的推理模型在解決問題時，通常會有一個think階段。這種方式雖然結(jié)果會大幅提升，但消耗的計(jì)算資源卻不少。

所以，這個文章研究的問題是： AI真的需要這么“認(rèn)真思考”嗎？

注：本文寫于o3發(fā)布之前， o3的思考充分利用工具能力，模型即產(chǎn)品，有一點(diǎn)跳脫o1版推理大模型的范疇了。另外，今天開源的Gemini 2.5 Flash，支持了thinking budget，有一些理念與本論文趨同。

所以他們用了 NoThinking 的方式，就是讓AI直接給出答案，跳過所有中間推理步驟。

就類似下圖框出來那樣，或者直接對比正常的模式。效果竟然還不錯。

推理大模型并非一定要推理-AI.x社區(qū)

省3~4倍資源。
始終優(yōu)于沒有經(jīng)過RL訓(xùn)練的非推理模型。
很適合多次嘗試，允許模型采樣多次，看pass@k的效果。
在一些任務(wù)中，跟正常思考的模型的結(jié)果差不多。

如下圖：

推理大模型并非一定要推理-AI.x社區(qū)

限定token預(yù)算（在達(dá)到指定token之后，強(qiáng)行添加，如答案是xxx 的內(nèi)容上去）之后，很多數(shù)據(jù)集表現(xiàn)比經(jīng)過think的效果更好。

推理大模型并非一定要推理-AI.x社區(qū)

本文轉(zhuǎn)載自??NLP前沿??，作者：NLP前沿

標(biāo)簽

已于2025-4-23 09:58:01修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

大模型一定就比小模型好？谷歌的這項(xiàng)研究說不一定

輕薄滴假象 ? 4009瀏覽 ? 0回復(fù)
KubeAI大模型推理加速實(shí)踐

卓勝微wjp ? 4528瀏覽 ? 0回復(fù)
排序模型一定要嘗試的特征交叉技巧，多場景驗(yàn)證有效

海因斯DK ? 7967瀏覽 ? 0回復(fù)
騰訊PCG自研高性能大語言模型推理引擎「一念LLM」正式開源

輕薄滴假象 ? 5193瀏覽 ? 0回復(fù)
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 7962瀏覽 ? 0回復(fù)
大模型的條件推理和模態(tài)推理

xuxiangda ? 4688瀏覽 ? 0回復(fù)
幾何視角下的大語言模型推理

sbf_2000 ? 3912瀏覽 ? 0回復(fù)
排序模型一定要嘗試的特征交叉技巧，多場景驗(yàn)證有效

海因斯DK ? 3938瀏覽 ? 0回復(fù)
不依賴CUDA的大模型推理已經(jīng)實(shí)現(xiàn)

夜行神魚 ? 4039瀏覽 ? 0回復(fù)
StaR ｜用少量推理數(shù)據(jù)讓模型學(xué)會通用推理能力，顯著提升模型復(fù)雜推理

arnoldzhw ? 5239瀏覽 ? 0回復(fù)
智能對話新紀(jì)元：大模型推理服務(wù)

AI論文解讀 ? 3347瀏覽 ? 0回復(fù)
多模態(tài)大模型能力評測基準(zhǔn)全面綜述：理解、推理、生成、應(yīng)用、趨勢

十一月雨_55 ? 1.3w瀏覽 ? 0回復(fù)
多模態(tài)大模型Reyes增加batch推理方式，提升推理速度

大模型自然語言處理 ? 3451瀏覽 ? 0回復(fù)
大語言模型推理框架llama.cpp開發(fā)實(shí)戰(zhàn)

51CTO內(nèi)容精選 ? 4051瀏覽 ? 0回復(fù)
大推理模型DeepSeek-R1深度解讀：成本降低95%，推動語言模型推理效率新高度

風(fēng)云2002_1 ? 1.4w瀏覽 ? 0回復(fù)
為什么 RAG 一定需要 Rerank？

玄姐聊AGI ? 3690瀏覽 ? 0回復(fù)
這十種方法你一定要知道

Halo咯咯 ? 3328瀏覽 ? 0回復(fù)
大模型推理能力的局限性

JavaEdge1 ? 2700瀏覽 ? 0回復(fù)
一篇多模態(tài)大模型推理技術(shù)最新綜述

PaperAgent ? 5200瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

字節(jié)的這個新模型，牛了！ 2025-09-22 07:05:49發(fā)布
Agent KB：讓Agent越用越聰明！ 2025-07-21 06:35:18發(fā)布

熱門推薦

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測中展現(xiàn)出驚人效率，僅用15秒便將百頁P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復(fù)

上一篇： llama 4，開源！

下一篇：高端的推理模型，僅需一個訓(xùn)練樣本！

社區(qū)精華內(nèi)容

目錄