偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

強(qiáng)迫模型自我爭論,遞歸思考版CoT熱度飆升!網(wǎng)友:這不就是大多數(shù)推理模型的套路嗎?

人工智能 新聞
遞歸思考 + 自我批判,CoRT 能帶來 LLM 推理力的飛躍嗎?

CoT(Chain-of-thought)大家都很熟悉了,通過模仿「人類解題思路」,進(jìn)而大幅提升語言模型的推理能力。

這幾天,一個(gè)名為 CoRT(Chain-of-Recursive-Thoughts)的概念火了!從名稱上來看,它在 CoT 中加入了「遞歸思考」這一步驟。

具體來講,CoRT 能讓 AI 模型遞歸地思考它們的響應(yīng),生成替代性方案,并從中選擇最佳的一個(gè)。

這就像賦予了 AI 自我質(zhì)疑或反駁的能力,并一遍一遍地嘗試。

通過將「結(jié)構(gòu)化自我批判」和「遞歸思考模式」結(jié)合起來,提升語言模型的推理能力。

圖片編輯助手\SCR-20250512-jzan.jpg

短短兩周時(shí)間,CoRT 在 GitHub 的星標(biāo)數(shù)已經(jīng)快突破 2k 了。

image.png

GitHub 地址:https://github.com/PhialsBasement/Chain-of-Recursive-Thoughts

從技術(shù)原理來講,相較于傳統(tǒng)的 CoT,CoRT 讓語言模型不僅能分步驟思考,還能在思考過程中反復(fù)回頭檢查、修正,形成類似于人類的「反思性思維」或「內(nèi)省」的推理路徑。

然而,很多網(wǎng)友對(duì) CoRT 的出現(xiàn)并沒有感到太激動(dòng)。CoRT 是讓 LLM 更努力思考的不錯(cuò)技巧,但稱不上什么新穎的 idea。它的工作原理就像一個(gè)加入了遞歸組件的元提示(meta-prompt)。

image.png


image.png

還有網(wǎng)友指出,這種方法在 2023 年的論文中《Improving Factuality and Reasoning in Language Models through Multiagent Debate》就出現(xiàn)了。

image.png

有網(wǎng)友發(fā)出疑問:CoRT 不就是現(xiàn)在大多數(shù) LLM 的思考模式嗎?

image.png

比如在 Cursor 中配置的 Gemini 2.5 Pro,它的 CoT 就是這樣做的。模型會(huì)思考一分鐘,并反駁自己的答案,直到找到最無力反駁的答案。

image.png

再比如,CoRT 不就是 Qwen 和 R1 中的「but wait」模式嗎?模型一直思考,并自我反駁,兩者似乎沒有什么不同。

image.png

大家覺得,CoRT 是不是「新瓶裝舊酒」呢?請(qǐng)?jiān)谠u(píng)論區(qū)留言。

項(xiàng)目介紹

根據(jù)項(xiàng)目介紹,CoRT 的訣竅在于以下四個(gè)方面:

  • 自我評(píng)估;
  • 有競爭力的替代生成方案;
  • 迭代優(yōu)化;
  • 動(dòng)態(tài)思維深度。

工作流程包括了以下四個(gè)步驟:

首先,AI 生成初始響應(yīng)。

其次,AI 決定它需要多少輪「思考」。

接著,對(duì)于每一輪思考:

  • 生成 3 個(gè)替代性響應(yīng);
  • 評(píng)估所有響應(yīng);
  • 選擇最佳響應(yīng)。

最后,最終響應(yīng)就是這場 AI 大混戰(zhàn)的幸存者。

Web 界面使用方式(仍處于早期開發(fā)階段)

一,打開 start_recthink.bat

二,等待一會(huì),讓它安裝依賴項(xiàng)

三,配置成功

如果你是運(yùn)行在 linux 系統(tǒng)上,則依如下:

image.png

打開一個(gè)新的殼層(shell):

image.png

效果怎么樣呢?

作者使用 Mistral 3.1 24B 進(jìn)行了測試,根據(jù)他的說法,CoRT 在編程任務(wù)中的表現(xiàn)從「meh」(一般般)升到了「holy crap」(碉堡了)。

我們來看一下示例,下圖為 Mistral 3.1 24B+CoRT:

image.png

下圖為 Mistral 3.1 24B 無 CoRT:

image.png

從結(jié)果來看,使用 CoRT 前后,Tic-tac-toe(井字棋)游戲從基礎(chǔ)的 CLI(命令行界面)變成了完全的 OOP(面向?qū)ο缶幊蹋?/span>

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-05-28 02:40:00

AdaptThink推理模型AI

2020-12-14 08:02:52

碼德代碼產(chǎn)品

2019-03-10 16:18:09

Facebook馬克·扎克伯微信

2025-03-05 00:22:00

2014-12-23 11:10:47

紅星LinuxLinux

2025-01-15 13:01:07

2025-05-30 02:00:00

獎(jiǎng)勵(lì)模型RRMAI

2019-05-09 09:34:34

API暴力破解安全

2009-07-14 15:39:34

Swing大多數(shù)控件

2022-02-22 10:53:14

Firefox火狐瀏覽器瀏覽器

2022-07-20 06:55:10

TCC分布式事務(wù)微服務(wù)

2022-03-10 10:06:57

數(shù)據(jù)治理美團(tuán)體系化建模

2011-05-26 10:50:31

2025-01-27 12:03:11

2014-01-02 10:34:54

設(shè)計(jì)設(shè)計(jì)師

2024-07-04 15:47:28

2025-06-10 03:30:00

2019-05-27 09:14:28

2025-05-13 05:11:00

推理模型微調(diào)

2024-09-24 11:01:03

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)