偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<style id="otxhf"></style>

<sup id="otxhf"><rt id="otxhf"></rt></sup>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

微軟推出 “從錯誤中學(xué)習(xí)” 模型訓(xùn)練法，號稱可“模仿人類學(xué)習(xí)過程，改善 AI 推理能力”

作者：漾仔 2023-11-07 14:07:51

研究人員的方法是使用一對包含“錯誤解答”與“修正后正確答案”的數(shù)據(jù)來微調(diào)相關(guān)模型。為取得相關(guān)數(shù)據(jù)，研究人員收集了 5 個不同大語言模型（包括 LLaMA 及 GPT 系列）的錯誤答案和推理過程，再以 GPT-4 作為“訂正者”，提供修正后的正確答案。

IT之家 11 月 7 日消息，微軟亞洲研究院聯(lián)合北京大學(xué)、西安交通大學(xué)等高校，提出了一項名為“從錯誤中學(xué)習(xí)（Learning from Mistake，LeMA）”的 AI 訓(xùn)練方法，號稱可以通過模仿人類學(xué)習(xí)知識的過程，來改進(jìn) AI 推理能力。

當(dāng)下 OpenAI GPT-4 和谷歌 aLM-2 等大語言模型在自然語言處理（NLP）任務(wù)，及思維鏈（chain-of-thought，CoT）推理的數(shù)學(xué)難題任務(wù)中都有不錯的表現(xiàn)。

但例如 LLaMA-2 及 Baichuan-2 等開源大模型，在處理相關(guān)問題時則有待加強。為了提升開源這些大語言模型的思維鏈推理能力，研究團隊提出了 LeMA 方法。這種方法主要是模仿人類的學(xué)習(xí)過程，通過“從錯誤中學(xué)習(xí)”，以改進(jìn)模型的推理能力。

▲ 圖源相關(guān)論文

IT之家發(fā)現(xiàn)，研究人員的方法是使用一對包含“錯誤解答”與“修正后正確答案”的數(shù)據(jù)來微調(diào)相關(guān)模型。為取得相關(guān)數(shù)據(jù)，研究人員收集了 5 個不同大語言模型（包括 LLaMA 及 GPT 系列）的錯誤答案和推理過程，再以 GPT-4 作為“訂正者”，提供修正后的正確答案。

據(jù)悉，修正后的正確答案中包含三類信息，分別是原推理過程中錯誤片段、原推理過程出錯的原因、以及如何修正原方法以獲得正確答案。

研究人員采用 GSM8K 及 MATH，來測試 LeMa 訓(xùn)練法對 5 個開源大模型的效果，結(jié)果顯示，以改進(jìn)過的 LLaMA-2-70B 為例，在 GSM8K 的準(zhǔn)確率分別為 83.5% 及 81.4%，在 MATH 則分別為 25.0% 及 23.6%。

目前研究人員已將 LeMA 的相關(guān)資料公開在 GitHub 上，感興趣的小伙伴們可以點此跳轉(zhuǎn)。

責(zé)任編輯：姜華來源： IT之家

GPT-4 大語言模型

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<p id="c1zq4"></p>

<tr id="c1zq4"><p id="c1zq4"></p></tr>