一篇120頁AI4Research(科學(xué)研究AI)最新系統(tǒng)性綜述
盡管AI在科學(xué)研究中的應(yīng)用取得了顯著進(jìn)展,但目前仍缺乏對AI在科學(xué)研究(AI4Research)中應(yīng)用的全面綜述,為了填補(bǔ)這一空白,提出了一個(gè)全面的AI4Research調(diào)查,旨在提供一個(gè)統(tǒng)一的視角,并系統(tǒng)地分類AI在研究中的應(yīng)用。
AI4Research的主流流程和分類,可以分為五個(gè)關(guān)鍵領(lǐng)域:(1)用于科學(xué)理解的AI,(2)用于學(xué)術(shù)調(diào)查的AI,(3)用于科學(xué)發(fā)現(xiàn)的AI,(4)用于學(xué)術(shù)寫作的AI,以及(5)用于學(xué)術(shù)同行評審的AI。這些領(lǐng)域各自有助于提升AI融合研究與出版的有效性和效率。
圖片
AI在研究中的分類(AI4Research)被劃分為五個(gè)關(guān)鍵領(lǐng)域。每個(gè)領(lǐng)域進(jìn)一步細(xì)分為具體任務(wù),突出了AI在整個(gè)研究過程中多樣化的角色。
圖片
一、用于科學(xué)理解的AI
AI能夠從科學(xué)文獻(xiàn)中提取、解釋和綜合信息,加速人類知識獲取和自動(dòng)分析效率。這包括文本科學(xué)理解(如半自動(dòng)和全自動(dòng)科學(xué)理解)以及表格和圖表科學(xué)理解。
圖片
文本科學(xué)理解
- 半自動(dòng)科學(xué)理解:AI在人類指導(dǎo)下逐步深入理解復(fù)雜科學(xué)文獻(xiàn)。例如,LaMAI通過提問澄清用戶查詢中的模糊點(diǎn),減少誤解;SciAgent通過調(diào)用計(jì)算器和公式評估器提供精確推理。
- 全自動(dòng)科學(xué)理解:AI獨(dú)立閱讀和理解科學(xué)文獻(xiàn),無需人類干預(yù)。例如,通過生成文章總結(jié)來增強(qiáng)對長篇科學(xué)文本的整體理解,或通過自我提問和反思來深化對科學(xué)內(nèi)容的理解。
表格和圖表科學(xué)理解
- 表格理解:AI通過數(shù)據(jù)增強(qiáng)和推理范式增強(qiáng)來提取、解釋和推斷表格中的數(shù)據(jù)。例如,Chain-of-Table通過逐步構(gòu)建和更新表格來提高對復(fù)雜表格的理解。
- 圖表理解:AI能夠直接處理和解釋圖表圖像,支持基于圖表內(nèi)容的問題回答和總結(jié)。例如,ChartQA和ChartX用于訓(xùn)練端到端和流水線模型,F(xiàn)DV提供圖表的結(jié)構(gòu)化文本表示,以實(shí)現(xiàn)更深入的理解。
二、用于學(xué)術(shù)調(diào)查的AI
AI技術(shù)可以系統(tǒng)地回顧和總結(jié)科學(xué)文獻(xiàn),幫助研究人員快速了解研究領(lǐng)域的最新進(jìn)展。這包括相關(guān)工作檢索和概述報(bào)告生成。
圖片
相關(guān)工作檢索
- 語義引導(dǎo)檢索:通過匹配用戶查詢的語義表示與文獻(xiàn)中的術(shù)語來檢索相關(guān)文獻(xiàn)。例如,GTSLNet通過基于關(guān)鍵詞的相似性學(xué)習(xí)網(wǎng)絡(luò)提高檢索的準(zhǔn)確性;
- 圖引導(dǎo)檢索:將學(xué)術(shù)實(shí)體(如論文、作者、引用)建模為圖結(jié)構(gòu),基于節(jié)點(diǎn)類型和粒度進(jìn)行檢索。
- LLM增強(qiáng)檢索:利用LLM的能力提升檢索系統(tǒng)的性能。例如,單智能體檢索直接使用LLM完成檢索任務(wù);多智能體檢索通過多個(gè)專業(yè)智能體簡化檢索過程;深度研究則進(jìn)一步向更自主的“深度研究”方向發(fā)展,AI智能體能夠從探索和綜合到生成引用豐富的報(bào)告。
概述報(bào)告生成
- 研究路線圖繪制:對大量文獻(xiàn)進(jìn)行清理、整合,描繪研究主題的發(fā)展軌跡。例如,CHIME通過迭代人類-AI協(xié)作細(xì)化LLM生成的結(jié)構(gòu);HiReview使用多層樹結(jié)構(gòu)進(jìn)行系統(tǒng)知識組織;SurveyEval提供層次化標(biāo)題樹,用于評估綜述生成的分布和引用準(zhǔn)確性。
- 章節(jié)級相關(guān)工作生成:生成相關(guān)工作章節(jié),與實(shí)際論文結(jié)構(gòu)對齊。
- 文檔級調(diào)查生成:自動(dòng)生成系統(tǒng)性文獻(xiàn)綜述。例如,AutoSurvey通過提示詞引導(dǎo)LLM完成階段性生成過程;
三、用于科學(xué)發(fā)現(xiàn)的AI
AI用于生成新的科學(xué)假設(shè)、理論或模型,并驗(yàn)證其有效性。這涉及想法挖掘、新穎性和重要性評估、理論分析和實(shí)驗(yàn)設(shè)計(jì)。
圖片
- 想法挖掘:AI從內(nèi)部知識、外部信號和團(tuán)隊(duì)討論中生成新科學(xué)假設(shè)或想法。
- 新穎性與重要性評估:AI評估想法的新穎性和重要性,結(jié)合傳統(tǒng)方法、LLM增強(qiáng)和人機(jī)協(xié)作。
- 理論分析:AI驗(yàn)證科學(xué)假設(shè)的合理性,包括主張形式化、證據(jù)收集、驗(yàn)證分析和定理證明。
- 科學(xué)實(shí)驗(yàn)開展:AI設(shè)計(jì)、執(zhí)行和分析科學(xué)實(shí)驗(yàn),涵蓋實(shí)驗(yàn)設(shè)計(jì)、前估計(jì)、管理、執(zhí)行和分析。
- 全自動(dòng)發(fā)現(xiàn):AI實(shí)現(xiàn)從假設(shè)生成到實(shí)驗(yàn)驗(yàn)證的全流程自動(dòng)化,形成閉環(huán)科學(xué)發(fā)現(xiàn)過程。
四、用于學(xué)術(shù)寫作的AI
AI工具協(xié)助研究人員撰寫、編輯和格式化科學(xué)論文,提高寫作質(zhì)量和效率。這包括在論文準(zhǔn)備、撰寫和完成階段的輔助。
圖片
半自動(dòng)學(xué)術(shù)寫作
- 寫作準(zhǔn)備階段:AI幫助生成論文標(biāo)題、優(yōu)化結(jié)構(gòu)、確保內(nèi)容連貫性,例如通過MoDeST和LLM-Rubric等工具生成多領(lǐng)域科學(xué)標(biāo)題。
- 寫作階段:AI協(xié)助繪制圖表、生成公式、推薦引用,例如FigGen和SciCapenter等工具支持從文本到圖表的生成,ScholarCopilot等工具實(shí)現(xiàn)智能引用推薦。
- 寫作完成后階段:AI進(jìn)行語法糾錯(cuò)、表達(dá)和邏輯修訂,例如通過AWE系統(tǒng)和AAAR-1數(shù)據(jù)集提供寫作質(zhì)量評估,Wikipedia Revision Histories數(shù)據(jù)集幫助優(yōu)化語言表達(dá)。
全自動(dòng)學(xué)術(shù)寫作
AI獨(dú)立完成從草稿撰寫到最終稿件生成的全過程,無需人工干預(yù)。例如,AI Scientist和Agent Laboratory等系統(tǒng)通過模擬同行評審和反饋循環(huán),優(yōu)化生成的論文內(nèi)容,但目前尚未完全消除人工編輯的需求,特別是在正確引用方面。
五、用于學(xué)術(shù)同行評審的AI
AI自動(dòng)化和增強(qiáng)同行評審過程,提供結(jié)構(gòu)化、客觀和建設(shè)性的評審。這包括預(yù)評審、評審和后評審階段。
圖片
- 預(yù)評審:AI在桌面評審階段快速評估稿件是否符合要求,并在審稿人匹配中實(shí)現(xiàn)精準(zhǔn)分配,同時(shí)避免利益沖突。
- 正在評審:AI生成評審意見和綜合評審報(bào)告,提升評審質(zhì)量和效率,減少主觀性和偏見。
- 后評審:AI預(yù)測論文影響力并生成宣傳材料,提升論文的可見度和影響力。
圖片
AI在研究中的多學(xué)科應(yīng)用:(a)自然科學(xué)中的AI,涵蓋物理學(xué)、生物學(xué)與醫(yī)學(xué)以及化學(xué)與材料科學(xué)等領(lǐng)域;(b)應(yīng)用科學(xué)與工程中的AI,重點(diǎn)關(guān)注機(jī)器人技術(shù)和軟件工程;(c)社會(huì)科學(xué)中的AI,包括社會(huì)學(xué)和心理學(xué)等學(xué)科。
圖片
https://arxiv.org/pdf/2507.01903
AI4Research: A Survey of Artificial Intelligence for Scientific Research
Projects: https://ai-4-research.github.io
Code Repository: https://github.com/LightChen233/Awesome-AI4Research






























