偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

用暫停token重新訓(xùn)練大模型,AI學(xué)會三思而后行

人工智能 新聞
整個研究基于一個簡單的想法:在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。這可以給模型額外的計算時間來處理更復(fù)雜的輸入。

讓ChatGPT給出答案之前多想想步驟,就能提高準(zhǔn)確率。

那么能不能省去提示詞,直接把這種能力內(nèi)化在大模型里呢?

CMU與谷歌團(tuán)隊的新研究,在訓(xùn)練大模型時加入暫停token來實現(xiàn)這一點。

圖片

實驗中,8項評測成績提升,其中SQuAD的EM得分提高18%,CommonSenseQA提高8%,GSM8k中的推理任務(wù)也提高1%。

圖片

研究者Jack Hack表示,自己不久前就提出類似假設(shè),很高興看到它被驗證。

圖片

英偉達(dá)工程師Aaron Erickson表示,是不是和人類說話時加入“嗯嗯啊啊”是一個道理?

圖片

預(yù)訓(xùn)練微調(diào)都加入暫停token

整個研究基于一個簡單的想法:

在輸入序列后面追加一系列(暫停token),從而延遲模型輸出下一個token。

這可以給模型額外的計算時間來處理更復(fù)雜的輸入。

圖片

作者不僅在下游任務(wù)微調(diào)時引入,還在預(yù)訓(xùn)練時就隨機在序列中插入,讓模型在兩階段都學(xué)習(xí)如何利用這種計算延遲。

圖片

預(yù)訓(xùn)練階段,在語料庫中隨機插入一定比例的暫停token到輸入序列,進(jìn)行標(biāo)準(zhǔn)的自回歸預(yù)訓(xùn)練。但計算損失時會跳過暫停token的預(yù)測。

下游任務(wù)微調(diào)時,輸入中也追加一定數(shù)量的暫停 token,然后對目標(biāo)序列進(jìn)行自回歸預(yù)測,同時微調(diào)模型參數(shù)。

推理階段也追加相同數(shù)量的暫停token,但忽略模型輸出直到最后一個暫停token,然后開始提取答案。

實驗使用了標(biāo)準(zhǔn)的Transformer純Decoder模型,分為130M參數(shù)和1B參數(shù)兩個版本。

其中暫停token只增加了1024個參數(shù),也就是它本身的embedding大小。

在9個不同任務(wù)上的實驗表明,僅在微調(diào)階段引入暫停token的效果并不明顯,有些任務(wù)不會提升。

但如果在預(yù)訓(xùn)練和finetune階段都使用暫停token,大多數(shù)任務(wù)上都獲得顯著提升。

論文還探究了暫停token的數(shù)量、位置等關(guān)鍵超參數(shù)。發(fā)現(xiàn)對于不同的模型通常存在一個最優(yōu)的數(shù)量。

最后作者也提出,這項工作也有不少局限性。

  • 由于暫停token增加了模型計算量,與其他方法對比是否公平還有待討論
  • 新方法需要重新預(yù)訓(xùn)練,在實際應(yīng)用還有一定困難
  • 對具體工作機制還缺乏深入理解
  • 推理時如果暫停token數(shù)量為0,模型表現(xiàn)仍然不佳

搜索引擎You.com的CEO表示,接下來是不是應(yīng)該把所有提高人類認(rèn)知表現(xiàn)的技巧都對大模型試一試?

圖片

現(xiàn)在已經(jīng)有了“一步一步地想”和“深呼吸”。

也許下一個爆款論文就是教大模型帶著問題睡一覺或者更離譜的健康飲食、注意鍛煉。

論文地址:https://arxiv.org/abs/2310.02226

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2018-08-08 06:49:35

云計算私有云公有云

2009-10-29 18:04:32

2011-03-29 15:53:28

數(shù)據(jù)庫管理

2015-02-26 14:10:58

部署虛擬化

2025-04-07 09:00:00

模型AI推理

2015-04-20 10:47:53

微服務(wù)容器技術(shù)PaaS

2011-02-18 10:22:30

2010-08-26 15:33:28

無線網(wǎng)絡(luò)

2013-09-11 11:00:59

HTML5企業(yè)

2023-10-16 13:39:00

AI智能

2025-02-18 08:00:00

2023-09-06 08:30:00

低代碼自動化開發(fā)

2010-02-01 16:39:32

Dell主板質(zhì)量

2023-07-18 15:14:04

人工智能自動化

2015-04-16 16:58:39

2013-12-09 11:06:47

2014-08-20 11:17:03

2016-01-05 15:40:07

2015-08-24 13:42:58

WiFi安全

2013-09-12 10:30:46

點贊
收藏

51CTO技術(shù)棧公眾號