偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

微軟推出 “從錯(cuò)誤中學(xué)習(xí)” 模型訓(xùn)練法,號稱可“模仿人類學(xué)習(xí)過程,改善 AI 推理能力”

人工智能
研究人員的方法是使用一對包含“錯(cuò)誤解答”與“修正后正確答案”的數(shù)據(jù)來微調(diào)相關(guān)模型。為取得相關(guān)數(shù)據(jù),研究人員收集了 5 個(gè)不同大語言模型(包括 LLaMA 及 GPT 系列)的錯(cuò)誤答案和推理過程,再以 GPT-4 作為“訂正者”,提供修正后的正確答案。

IT之家 11 月 7 日消息,微軟亞洲研究院聯(lián)合北京大學(xué)、西安交通大學(xué)等高校,提出了一項(xiàng)名為“從錯(cuò)誤中學(xué)習(xí)(Learning from Mistake,LeMA)”的 AI 訓(xùn)練方法,號稱可以通過模仿人類學(xué)習(xí)知識的過程,來改進(jìn) AI 推理能力。

當(dāng)下 OpenAI GPT-4 和谷歌 aLM-2 等大語言模型在自然語言處理(NLP)任務(wù),及思維鏈(chain-of-thought,CoT)推理的數(shù)學(xué)難題任務(wù)中都有不錯(cuò)的表現(xiàn)。

但例如 LLaMA-2 及 Baichuan-2 等開源大模型,在處理相關(guān)問題時(shí)則有待加強(qiáng)。為了提升開源這些大語言模型的思維鏈推理能力,研究團(tuán)隊(duì)提出了 LeMA 方法。這種方法主要是模仿人類的學(xué)習(xí)過程,通過“從錯(cuò)誤中學(xué)習(xí)”,以改進(jìn)模型的推理能力。

▲ 圖源 相關(guān)論文

IT之家發(fā)現(xiàn),研究人員的方法是使用一對包含“錯(cuò)誤解答”與“修正后正確答案”的數(shù)據(jù)來微調(diào)相關(guān)模型。為取得相關(guān)數(shù)據(jù),研究人員收集了 5 個(gè)不同大語言模型(包括 LLaMA 及 GPT 系列)的錯(cuò)誤答案和推理過程,再以 GPT-4 作為“訂正者”,提供修正后的正確答案。

據(jù)悉,修正后的正確答案中包含三類信息,分別是原推理過程中錯(cuò)誤片段、原推理過程出錯(cuò)的原因、以及如何修正原方法以獲得正確答案。

研究人員采用 GSM8K 及 MATH,來測試 LeMa 訓(xùn)練法對 5 個(gè)開源大模型的效果,結(jié)果顯示,以改進(jìn)過的 LLaMA-2-70B 為例,在 GSM8K 的準(zhǔn)確率分別為 83.5% 及 81.4%,在 MATH 則分別為 25.0% 及 23.6%。

目前研究人員已將 LeMA 的相關(guān)資料公開在 GitHub 上,感興趣的小伙伴們可以點(diǎn)此跳轉(zhuǎn)。

責(zé)任編輯:姜華 來源: IT之家
相關(guān)推薦

2025-05-12 14:29:16

絕對零外部數(shù)據(jù)訓(xùn)練法

2023-11-15 14:17:23

微軟語言模型AI 模型

2009-03-26 09:16:34

微軟裁員職位

2023-11-03 13:07:00

AI模型

2023-12-17 19:38:37

谷歌AI 模型人工智能

2024-01-15 14:44:19

語言模型PaLMAI

2023-06-27 12:56:23

微軟AI

2025-02-12 11:36:27

2024-01-25 10:09:21

自動駕駛技術(shù)

2024-11-25 07:10:00

NumPro視頻大模型AI

2024-01-19 09:10:25

微軟AI閱讀教練

2021-03-31 08:35:40

人工智能AIFacebook

2023-12-01 15:47:33

AI 模型

2025-03-11 08:37:17

2022-04-11 15:40:34

機(jī)器學(xué)習(xí)研究推理

2023-06-16 13:37:00

AI學(xué)習(xí)

2025-06-03 09:05:00

2020-07-23 18:00:32

人工智能AI

2024-02-06 10:09:31

微軟AI人工智能

2021-05-10 11:25:12

計(jì)算機(jī)互聯(lián)網(wǎng) 技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號