偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

草稿鏈代替思維鏈,推理token砍掉80%,顯著降低算力成本和延遲

人工智能 新聞
實驗遵循原始思維鏈論文,評估3類任務:算術推理、常識推理和符號推理。

推理token減少80%-90%,準確率變化不大,某些任務還能增加。

Zoom團隊提出思維鏈替代品“草稿鏈”,顯著降低延遲和算力成本。

圖片

原理很簡單,要求模型為每個推理步驟生成簡潔、信息密集的token。

圖片

這一思路受到人類解題過程啟發(fā),人類通常不會詳細闡述每一個細節(jié),只是簡單幾下關鍵的中間結果,作為草稿來輔助思考。

此外,草稿鏈方法簡單且易于實現(xiàn),不需要修改模型、微調(diào)或強化學習,只需更新提示詞中的示例即可,相關代碼和數(shù)據(jù)已在GitHub上開源。

圖片

研究團隊認為,與另一種降低延遲和計算成本的方法“在連續(xù)潛空間推理”相比,草稿鏈保留了可解釋性,且可以應用于閉源的黑盒模型。

第三方分析測算,對于每個月處理100萬個推理請求的企業(yè), 可以將成本從思維鏈的3800美元降低到760美元,每月節(jié)省超過3000美元。

圖片

實驗驗證:準確率不降,成本大幅降低

實驗遵循原始思維鏈論文,評估3類任務:算術推理、常識推理和符號推理。

算數(shù)推理任務選擇GSM8k數(shù)據(jù)集,從準確率看,標準提示下GPT-4o和Claude 3.5 Sonnet的準確率分別僅53.3%和64.6%,思維鏈使兩者均超95%,草稿鏈也達到91%左右。

在token使用上,思維鏈生成約200個token/響應,草稿鏈僅約40個,減少約80%。

延遲方面,草稿鏈使GPT-4o和Claude 3.5 Sonnet的平均延遲分別降低76.2%和48.4%。

圖片

常識推理選擇BIG-bench 的日期理解和運動理解任務也取得了相似的結果,特別值得注意的是Claude 3.5 Sonnet在草稿鏈下準確率還有所上升。

圖片

圖片

符號推理選擇拋硬幣任務,由于原數(shù)據(jù)集未公開,作者合成了250個示例的測試集。
草稿鏈在保持100%準確率的情況下大幅減少了推理token和延遲。

圖片

但草稿鏈方法也有一定的局限性:在零樣本設置下有效性會顯著下降。

圖片

此外,在參數(shù)量小于30億的小模型上,雖然草稿鏈仍能有效減少每個回答所需的token數(shù)并提高準確率,但與思維鏈相比,性能差距更大。

圖片

研究團隊推測,可能是由于訓練數(shù)據(jù)中缺乏草稿鏈風格的推理模式,在不提供few-shot樣本指導的情況下,很難生成簡潔而有幫助的”草稿”。

論文地址:https://arxiv.org/abs/2502.18600v2

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-03-24 13:45:56

2025-03-13 10:40:00

2011-06-10 13:21:09

SEO垃圾鏈接

2024-03-20 11:07:57

AI計算CPUGPU

2022-03-08 14:31:37

區(qū)塊鏈汽車技術

2024-12-18 14:53:28

2025-05-26 08:40:00

2025-06-04 08:35:00

2023-01-05 21:25:06

毫末

2020-02-02 19:00:28

區(qū)塊鏈供應鏈區(qū)塊鏈技術

2025-03-17 08:15:00

AI技術模型

2024-11-11 11:05:00

大語言模型系統(tǒng)

2025-02-08 17:00:11

2023-10-16 21:52:01

人工智能人工智能算力

2018-12-17 14:00:44

公有鏈聯(lián)盟鏈私有鏈

2024-05-14 09:22:51

模型技術

2023-06-05 10:01:18

模型測評

2023-01-04 20:00:02

SparseGPT降低算力成本

2024-08-12 09:40:00

模型數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號