AMD開源科研AI Agent,一站式自動(dòng)寫論文
科學(xué)研究的漫長(zhǎng)歷程中,受限于時(shí)間和資源,許多高質(zhì)量的研究想法未能得到充分探索。如果能夠減少探索想法的限制,研究人員將能夠同時(shí)研究多個(gè)概念,增加科學(xué)發(fā)現(xiàn)的效率。
所以,為了幫助科研人員節(jié)省時(shí)間快速撰寫論文,AMD和約翰·霍普金斯大學(xué)的研究人員聯(lián)合開源了一個(gè)專用于科研的AI Agent——Agent Laboratory。
你只需要提供概念想法,Agent Laboratory就能自動(dòng)檢索arXiv的文獻(xiàn)、完成實(shí)驗(yàn)設(shè)計(jì)、內(nèi)容生成和實(shí)驗(yàn)報(bào)告,一站式自動(dòng)化寫論文。
開源地址:https://github.com/SamuelSchmidgall/AgentLaboratory
Agent Laboratory的架構(gòu)主要是基于大模型,并由文獻(xiàn)綜述、實(shí)驗(yàn)設(shè)計(jì)和報(bào)告撰寫三大智能體聯(lián)合執(zhí)行。
在文獻(xiàn)綜述階段,PhD Student智能體扮演著關(guān)鍵角色。它利用arXiv API來(lái)檢索與研究主題相關(guān)的論文,并執(zhí)行三個(gè)主要?jiǎng)幼鳎赫?、全文和添加論文。PhD Student智能體通過(guò)多次查詢,評(píng)估每篇論文的相關(guān)性,并提煉出全面的綜述。
這個(gè)階段的目標(biāo)是為后續(xù)的研究階段提供堅(jiān)實(shí)的理論基礎(chǔ)和參考文獻(xiàn),確保研究方向的正確性和創(chuàng)新性。PhD Student智能體通過(guò)SUMMARY SEARCH QUERY命令,根據(jù)研究主題生成一個(gè)搜索查詢,以找到語(yǔ)義上相似的論文摘要。
然后,它會(huì)仔細(xì)篩選這些摘要,挑選出最相關(guān)的論文進(jìn)行深入閱讀。對(duì)于每篇精選的論文,PhD Student智能體會(huì)使用FULL_TEXT命令獲取論文的全文,以便更全面地理解研究?jī)?nèi)容。在閱讀和分析了多篇論文后,PhD Student智能體會(huì)使用ADD_PAPER命令,將認(rèn)為對(duì)研究項(xiàng)目有幫助的論文添加到官方綜述中。
接著,PhD Student智能體會(huì)不斷調(diào)整搜索查詢,以找到更多相關(guān)的文獻(xiàn),直到構(gòu)建出一個(gè)全面的文獻(xiàn)綜述,為后續(xù)的研究階段提供堅(jiān)實(shí)的理論支持。
ML Engineer智能體主要負(fù)責(zé)實(shí)驗(yàn)設(shè)計(jì),使用mle-solver工具來(lái)執(zhí)行實(shí)驗(yàn)。mle-solver是一個(gè)高度自動(dòng)化的模塊,它支持EDIT和REPLACE兩種代碼生成模式。
在命令執(zhí)行環(huán)節(jié),mle-solver首先會(huì)從維護(hù)的頂級(jí)程序集中采樣一個(gè)初始程序,然后通過(guò)REPLACE和EDIT操作,不斷調(diào)整代碼以更好地符合實(shí)驗(yàn)?zāi)繕?biāo)。EDIT操作允許mle-solver在指定的行范圍內(nèi)替換代碼,而REPLACE操作則會(huì)生成一個(gè)全新的Python文件。
在代碼執(zhí)行環(huán)節(jié),新的程序會(huì)被送入編譯器進(jìn)行編譯,檢查是否存在運(yùn)行時(shí)錯(cuò)誤。如果代碼成功編譯,它會(huì)獲得一個(gè)分?jǐn)?shù),并且如果這個(gè)分?jǐn)?shù)高于已有的程序,它將更新頂級(jí)程序列表。如果代碼編譯失敗,mle-solver會(huì)嘗試修復(fù)代碼,最多嘗試三次,然后返回錯(cuò)誤并繼續(xù)嘗試新的代碼替換。
程序評(píng)分環(huán)節(jié)使用一個(gè)獎(jiǎng)勵(lì)函數(shù)來(lái)評(píng)估代碼的有效性,這個(gè)獎(jiǎng)勵(lì)函數(shù)會(huì)根據(jù)研究計(jì)劃、生成的代碼和觀察到的輸出來(lái)確定程序與初始目標(biāo)的契合度。性能穩(wěn)定環(huán)節(jié)則通過(guò)自反思機(jī)制,不斷提升代碼的可靠性和穩(wěn)定性,確保代碼修改的穩(wěn)定性和一致性。
報(bào)告撰寫階段由PhD Student和Professor智能體共同完成。這一階段使用paper-solver工具,它負(fù)責(zé)將研究成果整合成一份符合學(xué)術(shù)標(biāo)準(zhǔn)的報(bào)告。paper-solver的工作流程開始于初始報(bào)告框架的生成,它通過(guò)REPLACE命令創(chuàng)建一個(gè)新的論文框架,并通過(guò)LaTeX編譯器驗(yàn)證格式。這個(gè)框架包括了論文的所有必要部分,如摘要、引言、背景、相關(guān)工作、方法、實(shí)驗(yàn)設(shè)置、結(jié)果和討論等。
在報(bào)告編輯環(huán)節(jié),使用EDIT命令進(jìn)行精細(xì)修改,支持行級(jí)別的編輯操作,并通過(guò)獎(jiǎng)勵(lì)函數(shù)評(píng)估論文質(zhì)量。論文評(píng)審環(huán)節(jié)則使用LLM Agent模擬NeurIPS流程,從多個(gè)維度對(duì)論文進(jìn)行評(píng)估,確保論文的質(zhì)量和創(chuàng)新性。
最后,通過(guò)PhD Student的決策,判斷是否需要對(duì)報(bào)告進(jìn)行修訂,必要時(shí)會(huì)回溯到前期環(huán)節(jié)進(jìn)行修改,直到報(bào)告達(dá)到滿意的標(biāo)準(zhǔn)。目前,該項(xiàng)目超3000顆星非?;鸨?/span>