AI花17小時寫了篇30頁學(xué)術(shù)論文!自主選題,包含實驗,還符合APA格式規(guī)范
不是拼湊知識點,AI這次是真搞研究。
一個叫Virtuous Machines的AI系統(tǒng),花了17小時、114美元,找了288個真人做實驗,寫了一篇30頁的學(xué)術(shù)論文。
圖片
而且還是從選題到成稿全自動化速通?。?/span>
來看看這個AI都寫了點啥。
AI自動化做科研:從靈光一現(xiàn)到可發(fā)表論文
像人類一樣搞科研
AI自主完成的這個論文屬于認(rèn)知心理學(xué)領(lǐng)域,具體聚焦于人類視覺認(rèn)知相關(guān)的研究方向。
而且它可不是瞎寫,而是靠人類的科研套路來。
圖片
先是基于認(rèn)知心理學(xué)理論提出研究問題,比如“視覺工作記憶與心理旋轉(zhuǎn)能力有沒有關(guān)系”、“心理意象清晰度對視覺認(rèn)知任務(wù)表現(xiàn)有什么影響”等。(視覺工作記憶是指人類維持并處理視覺信息的能力,涉及信息存儲、操作和提取過程;心理旋轉(zhuǎn)是指通過心理操作實現(xiàn)空間客體旋轉(zhuǎn)以完成知覺匹配的認(rèn)知過程)
圖片
接著設(shè)計實驗方案,考慮到了樣本量計算、控制變量,還用VVIQ2量表測量被試(對象)的心理意象清晰度;
在確定好實驗方案后,它還通過在線平臺Prolific招募了288名被試對象,等277份有效數(shù)據(jù)(部分被試未完成實驗,被AI篩除了)收上來,它又連續(xù)寫了8小時Python代碼,用重復(fù)測量方差處理數(shù)據(jù)。
在分析數(shù)據(jù)的過程中,甚至?xí)R別異常值、調(diào)整統(tǒng)計模型;
最后整理結(jié)果時,還能引用40+篇PubMed、Semantic Scholar上的真實文獻(xiàn),連論文的“方法”“結(jié)果”“討論”部分都符合APA格式規(guī)范。
這么高效,如何做到的?
不同功能的AI組隊,專人專職
那就來扒一下這個AI系統(tǒng)的架構(gòu)。
它的自主科研能力源于協(xié)作+模擬人類認(rèn)知機(jī)制+動態(tài)知識交互的技術(shù)設(shè)計。
在協(xié)同架構(gòu)中,Master是核心控制模塊,總領(lǐng)全局。
其他的AI助手模塊聚焦文獻(xiàn)檢索、數(shù)據(jù)分析、實驗設(shè)計等細(xì)分任務(wù)。
圖片
而支撐類人類認(rèn)知機(jī)制發(fā)揮作用的底層能力基礎(chǔ)則像“洋蔥圈”。
圖片
最核心的是知識檢索能力,能從海量學(xué)術(shù)數(shù)據(jù)庫精準(zhǔn)抓取知識;接著是抽象提煉能力,可從眾多具體研究里總結(jié)通用邏輯;再往上是元認(rèn)知反思能力,讓AI能自我檢查,比如做完數(shù)據(jù)分析會反問方法是否恰當(dāng)、結(jié)論與假設(shè)邏輯是否通順。
然后是任務(wù)分解能力,把科研大工程拆解成可執(zhí)行的小任務(wù),比如寫論文拆分為文獻(xiàn)綜述、實驗設(shè)計等環(huán)節(jié);還有自主迭代能力,無需人工干預(yù),AI會反復(fù)修改論文草稿、調(diào)試崩潰的代碼,直到滿意。
最外層是多智能體協(xié)作能力,不同功能的AI小助手組隊,讓系統(tǒng)做到文獻(xiàn)檢索、實驗設(shè)計、數(shù)據(jù)分析專人專職。
除此之外,還有個d-RAG實時記憶庫,能一邊查最新文獻(xiàn),一邊記自己之前的研究,新老知識能交互整合。
這一套架構(gòu)下來,17小時寫出30頁論文也算是手拿把掐。
速度很快,小缺點也有
不過,這AI雖然卷,但也不是完美的。
雖然優(yōu)點很明顯:效率比人類團(tuán)隊快10倍以上,數(shù)據(jù)分析嚴(yán)謹(jǐn)?shù)綍芙^統(tǒng)計顯著性陷阱(就算p<0.05,但如果效應(yīng)量過小,也會說明“結(jié)果實際意義有限”),還能處理真實實驗中的噪音數(shù)據(jù)等。
但它偶爾也會出現(xiàn)理論誤解,比如把已有研究結(jié)論說成首次發(fā)現(xiàn);漏標(biāo)圖表的Y軸單位、把“跨試次間隔”和“刺激呈現(xiàn)間隔”混用等。
只能說,AI搞研究速度是挺牛,但想完全取代人類研究員的理論深度和創(chuàng)新思維,目前看來還差點意思~
研究地址:https://arxiv.org/abs/2508.13421
參考鏈接:https://x.com/IntuitMachine/status/1972252510585847835















 
 
 














 
 
 
 