偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

7B小模型寫好學(xué)術(shù)論文,新框架告別AI引用幻覺,實測100%學(xué)生認(rèn)可引用質(zhì)量

人工智能 新聞
加拿大滑鐵盧大學(xué)與卡內(nèi)基梅隆大學(xué)的華人研究團(tuán)隊,提出了一種名為 ScholarCopilot 的智能學(xué)術(shù)寫作大模型框架,專門針對學(xué)術(shù)場景,致力于精準(zhǔn)地生成帶有準(zhǔn)確引用的學(xué)術(shù)文本。

學(xué)術(shù)寫作通常需要花費大量精力查詢文獻(xiàn)引用,而以ChatGPT、GPT-4等為代表的通用大語言模型(LLM)雖然能夠生成流暢文本,但經(jīng)常出現(xiàn)“引用幻覺”(Citation Hallucination),即模型憑空捏造文獻(xiàn)引用。這種現(xiàn)象嚴(yán)重影響了學(xué)術(shù)論文的可信度與專業(yè)性。

現(xiàn)在,加拿大滑鐵盧大學(xué)與卡內(nèi)基梅隆大學(xué)的華人研究團(tuán)隊,提出了一種名為 ScholarCopilot 的智能學(xué)術(shù)寫作大模型框架,專門針對學(xué)術(shù)場景,致力于精準(zhǔn)地生成帶有準(zhǔn)確引用的學(xué)術(shù)文本。

圖片

ScholarCopilot與傳統(tǒng)方法的區(qū)別

圖片

傳統(tǒng)的檢索增強(qiáng)生成(Retrieval-Augmented Generation, RAG)方法采用“先檢索、再生成”的靜態(tài)流程,這種方式存在以下問題:

  • 檢索與生成過程相互獨立,容易導(dǎo)致意圖不匹配;
  • 無法根據(jù)上下文需求動態(tài)調(diào)整引用策略,影響引用準(zhǔn)確性。

針對這些局限性,ScholarCopilot提出了一種“邊生成、邊檢索”的動態(tài)機(jī)制:

  • 在生成文本時,模型動態(tài)地判斷何時需要引用文獻(xiàn),并生成一個特殊的檢索信號([RET]);
  • 隨后實時檢索學(xué)術(shù)數(shù)據(jù)庫中的相關(guān)文獻(xiàn),將檢索到的內(nèi)容融入后續(xù)生成過程;
  • 通過聯(lián)合優(yōu)化生成任務(wù)和檢索任務(wù),提升引用的準(zhǔn)確度與相關(guān)性。

簡單來說,ScholarCopilot的寫作方式更接近人類真實的寫作習(xí)慣:平時正常撰寫論文內(nèi)容,當(dāng)需要引用文獻(xiàn)時再主動檢索相關(guān)文獻(xiàn)的BibTeX信息插入引用,隨后繼續(xù)撰寫下文。同時,模型在撰寫后續(xù)內(nèi)容時,也會參考已插入的引用文獻(xiàn),確保生成的文本與引用內(nèi)容緊密相關(guān)。

ScholarCopilot的性能表現(xiàn)

研究團(tuán)隊以阿里云近期發(fā)布的Qwen-2.5-7B模型為基礎(chǔ),使用了50萬篇arXiv論文進(jìn)行訓(xùn)練,并在多個維度上進(jìn)行了性能評估:

引用檢索準(zhǔn)確性(Top-1 accuracy)達(dá)到40.1%,顯著超過現(xiàn)有的檢索模型:

  • E5-Mistral-7B-Instruct(15.0%)
  • BM25(9.8%)

圖片

論文生成質(zhì)量方面(包括相關(guān)性、連貫性、學(xué)術(shù)嚴(yán)謹(jǐn)性、完整性和創(chuàng)新性),綜合得分為16.2(滿分25),高于參數(shù)量更大的Qwen-2.5-72B-Instruct模型(15.8)和Qwen-2.5-7B-Instruct模型(13.9)。

圖片

在一項由10位擁有平均4.2年學(xué)術(shù)寫作經(jīng)驗的學(xué)生(5名博士、4名碩士、1名本科生)參與的真人評測中:

  • ScholarCopilot在引用質(zhì)量上的用戶偏好率達(dá)到100%;
  • 整體實用性偏好率超過70%。

圖片

ScholarCopilot的不足與未來方向

盡管取得了顯著進(jìn)步,ScholarCopilot仍存在一些局限性。通過上述用戶調(diào)研,受訪者提出了以下幾點改進(jìn)建議:

  • 內(nèi)容生成更全面:模型在生成內(nèi)容的豐富性與信息全面性方面仍需進(jìn)一步提升;
  • 創(chuàng)新性不足:目前模型在生成創(chuàng)新性想法和研究問題方面表現(xiàn)一般,還有較大改進(jìn)空間。

此外,受訪者還建議未來版本可考慮:

  • 與主流學(xué)術(shù)寫作平臺(如Overleaf)進(jìn)行更緊密的整合;
  • 支持分章節(jié)獨立生成和任意光標(biāo)位置的文本預(yù)測功能。

研究團(tuán)隊表示,這些反饋意見為后續(xù)開發(fā)提供了明確的改進(jìn)方向。

后續(xù)展望

ScholarCopilot研究團(tuán)隊希望通過不斷優(yōu)化模型性能、擴(kuò)展檢索數(shù)據(jù)庫和改進(jìn)用戶交互體驗,讓研究人員在學(xué)術(shù)寫作中能更專注于研究本身,而非繁瑣的文獻(xiàn)檢索與引用管理。

當(dāng)前相關(guān)論文、代碼與模型已經(jīng)公開發(fā)布,感興趣的讀者可自行了解詳細(xì)信息,進(jìn)一步體驗與評估該模型的實際表現(xiàn):

論文鏈接:https://arxiv.org/pdf/2504.00824
項目網(wǎng)站:https://tiger-ai-lab.github.io/ScholarCopilot/
演示視頻:https://www.youtube.com/watch?v=QlY7S52sWDA

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2024-02-04 08:00:00

Zephyr 7B大語言模型算法

2023-10-13 19:58:33

Mistral7B模型

2024-04-02 09:17:50

AI數(shù)據(jù)開源

2025-05-08 06:00:00

AI幻覺AI人工智能

2023-12-12 13:51:00

AI訓(xùn)練

2025-06-18 08:47:00

2024-03-25 08:00:00

2024-06-03 10:43:34

2025-04-25 10:57:39

2024-07-22 09:00:00

2024-07-17 13:40:01

2024-11-04 10:20:00

模型數(shù)據(jù)

2023-01-16 14:37:24

PyTorch論文

2019-10-20 20:22:05

Python 開發(fā)編程語言

2024-08-13 14:40:00

AI科學(xué)家

2024-05-09 08:33:33

2024-09-05 14:25:00

訓(xùn)練代碼

2025-02-25 12:30:00

2025-02-19 10:01:51

AIChatGPT人工智能

2018-05-07 09:12:17

Linuxgroff -me格式化
點贊
收藏

51CTO技術(shù)棧公眾號