偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

科研智能體「漫游指南」—助你構(gòu)建領(lǐng)域?qū)倏蒲兄悄荏w

人工智能 新聞
希望本「漫游指南」能啟發(fā) AI 研究者與具體自然科學(xué)研究者,促進(jìn) AI 與自然科學(xué)之間的深度融合。

歡迎關(guān)注中國科學(xué)院自動化研究所 & 北京中關(guān)村學(xué)院 & 芝加哥大學(xué) & 西湖大學(xué) & 騰訊帶來的科研智能體方面的最新綜述調(diào)研。

當(dāng)前基于大語言模型(LLM)的智能體構(gòu)建通過推動自主科學(xué)研究推動 AI4S 迅猛發(fā)展,催生一系列科研智能體的構(gòu)建與應(yīng)用。然而人工智能與自然科學(xué)研究之間認(rèn)知論與方法論的偏差,對科研智能體系統(tǒng)的設(shè)計、訓(xùn)練以及驗證產(chǎn)生著較大阻礙。

與傳統(tǒng)綜述不同,本篇綜述為大家呈現(xiàn)了科研智能體的「漫游指南」,旨在提供構(gòu)建科研智能體的「說明指南」:從科學(xué)研究的全周期出發(fā),概述了科研智能體的分級策略,并詳細(xì)闡述了對應(yīng)等級的構(gòu)建策略與能力邊界;同時該「漫游指南」詳細(xì)闡明了如何從頭構(gòu)建科研智能體,以及如何對科研智能體的定向能力進(jìn)行增強。同時「指南」中詳細(xì)涵蓋了科研智能體的概念闡述、構(gòu)建方案、基線評估以及未來方向。

希望本「漫游指南」能啟發(fā) AI 研究者與具體自然科學(xué)研究者,促進(jìn) AI 與自然科學(xué)之間的深度融合。

  • 論文地址:https://doi.org/10.36227/techrxiv.175459840.02185500/v1
  • 倉庫地址:https://github.com/gudehhh666/Awesome_Scientific_Agent.git

綜述的核心貢獻(xiàn)如下:

  • 在系統(tǒng)性探索科研智能體領(lǐng)域的過程中,本綜述尤其注重對自然科學(xué)領(lǐng)域的科研智能體的深入而嚴(yán)謹(jǐn)?shù)慕鈽?gòu)分析,尤其就其構(gòu)建策略與能力范圍而提出了針對科研智能體的三級分級系統(tǒng)。
  • 該綜述提供了一套全面而細(xì)致的實踐指南,涵蓋從零構(gòu)建科研智能體的基礎(chǔ)流程,到針對特定能力對現(xiàn)有智能體進(jìn)行定向能力增強,進(jìn)一步提升現(xiàn)有科研智能體系統(tǒng)的能力與性能。
  • 通過結(jié)合科學(xué)研究全生命周期與科研智能體構(gòu)建策略,本綜述深入剖析了構(gòu)建策略與科研流程之間相互促進(jìn)與協(xié)同的過程,揭示了科研智能體設(shè)計與應(yīng)用之間的獨特聯(lián)系。

圖 1|科研智能體對于科研過程全生命周期的介入

科研智能體分級策略

圖 2|科研智能體分級示意

根據(jù)構(gòu)建策略與其能力邊界的等級劃分,科研智能體被我們分為三個等級:

  • Agent as Assistant:該等級的智能體通常局限于特定領(lǐng)域的較單一任務(wù),而無法進(jìn)行跨多個科研流程的綜合性操作。其構(gòu)建策略往往使用小模型經(jīng)過后訓(xùn)練(Post-training)或微調(diào)(Fine-tuning)而完成。其能力往往局限于被專門訓(xùn)練過的領(lǐng)域任務(wù)。其能夠在一個專門任務(wù)上達(dá)到很高的水準(zhǔn),但是無法承擔(dān)起全面統(tǒng)籌各個科研過程的能力。
  • Agent as Partner:該等級的智能體較 Assistant 最大的飛躍便是充分集成各類工具以實現(xiàn)自身能力的躍遷。其構(gòu)建策略上逐步轉(zhuǎn)向更加系統(tǒng)化的架構(gòu)設(shè)計,采用閉源大型模型,并結(jié)合豐富的上下文信息進(jìn)行優(yōu)化。它們的設(shè)計不僅僅是優(yōu)化單個任務(wù)的性能,而是將多個任務(wù)拆解并進(jìn)行模塊化設(shè)計。其能力范圍主要在于在特定領(lǐng)域內(nèi)獨立完成文獻(xiàn)咨詢、假設(shè)生成和實驗設(shè)計等任務(wù),然而,許多這類智能體仍然局限于知識獲取工具的集成,在復(fù)雜任務(wù)的自我驗證和可靠性方面存在局限。
  • Agent as Avatar:該等級智能體側(cè)重于多個維度的能力增強,其具備了強大的推理能力、深度記憶和強協(xié)作能力,能夠在科學(xué)研究的各個階段提供全面支持。其構(gòu)建策略轉(zhuǎn)向?qū)υ兄悄荏w能力的定向增強:通過深度協(xié)作和增強的記憶能力進(jìn)行設(shè)計,能夠處理復(fù)雜的科學(xué)問題,并協(xié)調(diào)不同工具進(jìn)行任務(wù)執(zhí)行。其能力也不簡單傾向于單一領(lǐng)域,它們能夠跨學(xué)科地應(yīng)用并協(xié)作解決科研難題。

圖 3|不同等級科研智能體匯總

從頭構(gòu)建科研智能體

本綜述凝練了科研智能體的構(gòu)建過程,從頭構(gòu)建科研智能體的工作流主要為知識組織、知識注入以及工具集成三個部分構(gòu)成。

知識組織:知識組織定義了科學(xué)信息如何被結(jié)構(gòu)化,以便使智能體能夠有效地理解和推理。它涵蓋非結(jié)構(gòu)化序列(例如研究論文和書籍)、結(jié)構(gòu)化數(shù)據(jù)(例如基因表達(dá)數(shù)據(jù)集)、指令(例如問答對)以及知識圖譜,每種方式都提供了獨特的方式來表示和檢索領(lǐng)域知識。這些組織策略作為智能體推理、歸納和決策的基礎(chǔ),對于科學(xué)發(fā)現(xiàn)至關(guān)重要。

知識注入:知識注入涉及將特定領(lǐng)域的專業(yè)知識嵌入科學(xué)智能體中,這可以通過顯式或隱式方法實現(xiàn)。顯式注入直接將知識整合到提示中或針對特定任務(wù)優(yōu)化提示,而隱式注入通常涉及微調(diào)模型或使用強化學(xué)習(xí)來使智能體的響應(yīng)適應(yīng)特定領(lǐng)域。這兩種方法都旨在通過注入相關(guān)專業(yè)知識來增強智能體解決特定領(lǐng)域科學(xué)挑戰(zhàn)的能力。

工具集成:工具集成通過將外部工具用于專業(yè)任務(wù)(如專業(yè)知識獲取、執(zhí)行和模擬、分析以及可視化)來擴展智能體的功能。通過選擇和集成特定領(lǐng)域的工具,科研智能體可以更高效地執(zhí)行復(fù)雜任務(wù)。這些工具的有效集成使科研智能體能夠自主運行,協(xié)調(diào)各種資源以協(xié)助科學(xué)研究與發(fā)現(xiàn)。

科研智能體能力增強

  • 記憶增強:記憶增強對于科學(xué)智能體實現(xiàn)類人智能和長期高效運作至關(guān)重要。它使智能體能夠保持上下文、執(zhí)行多步推理并積累經(jīng)驗知識。記憶結(jié)構(gòu),如塊、知識三元組、原子事實、摘要和例程,服務(wù)于不同的記憶功能,從存儲上下文信息到細(xì)粒度的事實知識。記憶系統(tǒng)分為以上下文為中心和以行動為中心兩種方法,前者側(cè)重于在長時間內(nèi)保持可靠的上下文,后者則增強動態(tài)任務(wù)適應(yīng)和技能泛化能力。這些記憶改進(jìn)使智能體能夠執(zhí)行更復(fù)雜的任務(wù),并保留相關(guān)知識以供未來使用。
  • 推理增強:推理增強旨在解決 LLMs 的局限性,例如幻覺和不一致性,特別是在科學(xué)任務(wù)中。通過結(jié)構(gòu)化推理鏈(例如 CoT 和多輪推理)以及自洽性驗證等機制,科學(xué)場景中的通用推理能力得到提升,從而提高智能體輸出的可靠性和透明度。領(lǐng)域特定推理優(yōu)化通過引入領(lǐng)域偏好指導(dǎo)(確保在特定領(lǐng)域內(nèi)進(jìn)行邏輯推理)和符號演繹(將符號推理與概率模型相結(jié)合),進(jìn)一步提升了智能體的推理能力,使其在復(fù)雜的科學(xué)探究中能夠做出更精確和一致的推論。
  • 協(xié)作增強:協(xié)作增強著重于改善多智能體系統(tǒng)之間以及智能體與人類在科學(xué)研究中的交互。在多智能體協(xié)作中,智能體專注于特定角色,參與結(jié)構(gòu)化對話和辯論,并高效共享知識。角色專業(yè)化和結(jié)構(gòu)化協(xié)議等方法有助于解決角色重疊和信息流等挑戰(zhàn)。人機協(xié)作得益于明確的目標(biāo)設(shè)定和反饋機制,使人類研究人員能夠提供戰(zhàn)略指導(dǎo)并監(jiān)督智能體任務(wù)。自然語言界面促進(jìn)無縫溝通,減少人類與 AI 之間的技術(shù)障礙。這些增強確保智能體和人類能夠有效協(xié)作,優(yōu)化研究成果,并促進(jìn)更具活力的科學(xué)發(fā)現(xiàn)過程。

基準(zhǔn)與評估

根據(jù)現(xiàn)有基準(zhǔn)的側(cè)重不同,基準(zhǔn)主要分為知識密集型任務(wù)以及實驗驅(qū)動型任務(wù),兩者對于整體科學(xué)研究過程中各有側(cè)重。

知識密集型:科研智能體主要設(shè)計用于處理需要深厚專業(yè)知識的復(fù)雜、特定領(lǐng)域的任務(wù)。這些任務(wù)通常圍繞知識傳播展開,包括文獻(xiàn)挖掘、研究假設(shè)生成、實驗設(shè)計、結(jié)果分析和評估。這類任務(wù)要求智能體在專業(yè)領(lǐng)域具備認(rèn)知能力,而非簡單的一般知識。

實驗驅(qū)動型:面向科研智能體的實驗驅(qū)動任務(wù)評估代理在科學(xué)探究中使用工具的能力,強調(diào)自主實驗設(shè)計、驗證以及在科學(xué)環(huán)境中的多過程探索。

圖 4|基準(zhǔn)測試匯總

未來研究方向

  • 事實性與合理性:確??茖W(xué)實驗設(shè)計的實證準(zhǔn)確性和理性仍然是一個主要挑戰(zhàn),需要更好地整合驗證工具和反饋機制;
  • 復(fù)雜任務(wù)適配框架設(shè)計:科學(xué)智能體需要靈活、連貫的框架,以適應(yīng)特定的研究領(lǐng)域,從而克服現(xiàn)有復(fù)雜、特定領(lǐng)域系統(tǒng)的局限性;
  • 自我迭代進(jìn)化:為了持續(xù)進(jìn)步,科學(xué)智能體需要融入自我反思和持續(xù)迭代機制,重點在于平衡情景記憶和參數(shù)記憶,以防止知識丟失并支持長期發(fā)展;
  • 面向科學(xué)探索的交互優(yōu)化:優(yōu)化智能體與人類研究人員的交互對于推動科學(xué)發(fā)現(xiàn)至關(guān)重要。未來的系統(tǒng)應(yīng)當(dāng)整合通用和專用模型,以促進(jìn)跨學(xué)科的動態(tài)有效合作;
  • 多學(xué)科智能體:科學(xué)智能體可以通過促進(jìn)跨學(xué)科知識轉(zhuǎn)移來增強其專業(yè)知識,從而加強其在相關(guān)研究領(lǐng)域的執(zhí)行能力,并提高整體性能;
  • 科學(xué)評估與驗證:評估人工智能驅(qū)動的科學(xué)研究仍然是一項復(fù)雜的挑戰(zhàn),需要創(chuàng)新的方法來構(gòu)思開放式研究任務(wù),并確保智能體遵循可證偽性和可重復(fù)性等核心科學(xué)原則。



責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-14 13:54:01

AI模型測試

2025-04-07 02:00:00

2025-05-20 08:00:45

2017-07-13 12:09:14

人工智能科研

2024-09-12 15:10:00

AI智能體

2025-06-12 01:30:00

智能體Dify游戲智能體

2025-08-27 03:22:00

AI智能體系統(tǒng)

2025-06-23 08:17:54

2025-06-19 03:30:00

智能體DifyMCP

2025-06-27 07:00:00

智能體人工智能AI

2025-04-14 00:22:00

2025-04-01 08:05:00

智能體人工智能MCP

2024-10-18 15:20:00

2024-06-13 09:20:26

2025-09-04 01:35:00

AI工作流智能體

2023-09-03 12:50:59

AI技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號