偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作

發(fā)布于 2025-4-16 06:04

瀏覽

0收藏

在學(xué)術(shù)寫作中，精準(zhǔn)引用與優(yōu)質(zhì)文本生成至關(guān)重要，現(xiàn)有檢索 - 增強生成系統(tǒng)卻難以滿足需求。今天為大家?guī)硪黄芯砍晒榻B，文中提出的ScholarCopilot框架，能訓(xùn)練大語言模型助力學(xué)術(shù)寫作。它表現(xiàn)如何？又有哪些創(chuàng)新？快來一探究竟。

參考文獻(xiàn)

@article{wang2024scholarcopilot,
  title={ScholarCopilot: Training Large Language Models for Academic Writing with Accurate Citations},
  author = {Wang, Yubo and Ma, Xueguang and Nie, Ping and Zeng, Huaye and Lyu, Zhiheng and Zhang, Yuxuan and Schneider, Benjamin and Lu, Yi and Yue, Xiang and Chen, Wenhu},
  journal={arXiv preprint arXiv:2504.00824},
  year={2025}
}

摘要

學(xué)術(shù)寫作既需要連貫的文本生成，也需要對相關(guān)文獻(xiàn)進行精確引用。盡管近期的檢索增強生成（RAG）系統(tǒng)在通用文本生成中大幅提升了事實準(zhǔn)確性，但其支持專業(yè)學(xué)術(shù)寫作的能力仍較為有限。在本研究中，本研究推出了ScholarCopilot，這是一個統(tǒng)一框架，旨在強化現(xiàn)有的大語言模型，使其能夠生成帶有精準(zhǔn)且貼合上下文引用的專業(yè)學(xué)術(shù)文章。ScholarCopilot通過生成檢索令牌[RET]動態(tài)判斷何時檢索學(xué)術(shù)參考文獻(xiàn)，隨后利用該令牌查詢引文數(shù)據(jù)庫。檢索到的參考文獻(xiàn)會被輸入模型，以優(yōu)化生成過程。本研究在單一框架內(nèi)對文本生成和引文檢索任務(wù)進行聯(lián)合優(yōu)化，以此提高效率。本研究的模型基于Qwen-2.5-7B構(gòu)建，并在arXiv上的50萬篇論文上進行訓(xùn)練。在本研究的評估數(shù)據(jù)集上，其 top-1檢索準(zhǔn)確率達(dá)到40.1% ，超越了諸如E5-Mistral-7B-Instruct（15.0%）和BM25（9.8%）等基線模型。在包含1000個學(xué)術(shù)寫作樣本的數(shù)據(jù)集上，ScholarCopilot在生成質(zhì)量（從相關(guān)性、連貫性、學(xué)術(shù)嚴(yán)謹(jǐn)性、完整性和創(chuàng)新性等方面衡量）的評分達(dá)到16.2/25，顯著優(yōu)于所有現(xiàn)有模型，包括檢索增強型的Qwen2.5-72B-Instruct等規(guī)模更大的模型。用戶研究進一步表明，盡管ScholarCopilot是一個70億參數(shù)規(guī)模的模型，但在引用質(zhì)量上的受青睞程度遠(yuǎn)超ChatGPT，獲得了100%的偏好度；在整體實用性方面，其偏好度也超過70%。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

圖1：傳統(tǒng)檢索增強生成（RAG）系統(tǒng)與本研究提出的ScholarCopilot的對比. 傳統(tǒng)RAG系統(tǒng)（左圖）將檢索和生成過程分開執(zhí)行，這會導(dǎo)致表示不一致。相比之下，ScholarCopilot（右圖）在文本生成過程中動態(tài)生成檢索令牌[RET]，用于一體化且具備上下文感知能力的參考文獻(xiàn)檢索。

傳統(tǒng)RAG與ScholarCopilot的對比

本研究介紹的ScholarCopilot是一個用于學(xué)術(shù)寫作的智能RAG框架，它能夠動態(tài)整合文本生成和引文檢索功能。與傳統(tǒng)的分階段檢索和生成方法不同，本研究的系統(tǒng)會依據(jù)上下文的變化生成特殊的檢索令牌[RET]，暫停文本生成以檢索相關(guān)參考文獻(xiàn)，并將其內(nèi)容融入后續(xù)步驟中。檢索令牌的表示通過對比學(xué)習(xí)進行優(yōu)化，以便實現(xiàn)高效的相似性搜索。ScholarCopilot還支持在迭代過程中由用戶進行可選的優(yōu)化，在不增加額外成本的情況下，提升引用準(zhǔn)確性和內(nèi)容連貫性。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

數(shù)據(jù)集管理

本研究構(gòu)建了一個大規(guī)模數(shù)據(jù)集，包含50萬篇arXiv上的計算機科學(xué)論文，其中1000萬條引用來自arXiv，680萬條來自語義學(xué)者（論文可能會被多次引用）。數(shù)據(jù)集的創(chuàng)建涵蓋五個階段：1）論文收集；2）結(jié)構(gòu)解析；3）引文提??；4）參考文獻(xiàn)匹配；5）數(shù)據(jù)集整合。每篇論文平均有38次引用，其中87%能夠成功匹配到學(xué)術(shù)數(shù)據(jù)庫。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

訓(xùn)練方法

ScholarCopilot通過兩個目標(biāo)對文本生成和引文檢索進行聯(lián)合優(yōu)化：一是用于文本生成的下一個令牌預(yù)測，二是用于引文檢索的對比學(xué)習(xí)。在文本生成方面，它采用標(biāo)準(zhǔn)的自回歸語言建模方法，基于前文的令牌和檢索到的內(nèi)容最大化當(dāng)前令牌出現(xiàn)的概率。在引文檢索方面，它運用對比學(xué)習(xí)優(yōu)化檢索令牌的表示，增大這些令牌與相關(guān)引文之間的相似性，同時降低與無關(guān)引文的相似性。正例引用來自真實論文，而負(fù)例則通過批量采樣獲取。系統(tǒng)通過最小化一個組合損失函數(shù)（）來進行訓(xùn)練。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

生成質(zhì)量評估

本研究對不同基線模型的生成質(zhì)量進行了比較。主要發(fā)現(xiàn)如下：（1）ScholarCopilot的評分為16.21/25 ，超越了參數(shù)規(guī)模為其10倍的模型；（2）在相關(guān)性（3.63）和連貫性（3.66）方面表現(xiàn)尤為突出，可與720億參數(shù)規(guī)模的模型相媲美；（3）通過本研究統(tǒng)一的生成和引用方法，顯著提升了學(xué)術(shù)嚴(yán)謹(jǐn)性（2.87對比2.26 ）。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

引文準(zhǔn)確性評估

在此，本研究對不同方法的引文檢索性能進行了比較。ScholarCopilot顯著優(yōu)于E5-Mistral-7B-Instruct和BM25等基線模型，其top-1召回率達(dá)到40.1%，recall@10達(dá)到64.8% 。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

用戶研究

為評估ScholarCopilot的實際應(yīng)用價值，本研究開展了一項用戶研究，邀請了10位學(xué)術(shù)人員參與（5名博士、4名碩士、1名本科生），他們的平均寫作經(jīng)驗為4.2年。參與者使用本研究的系統(tǒng)撰寫學(xué)術(shù)內(nèi)容，并從多個維度進行評分。ScholarCopilot在引用準(zhǔn)確性（4.6/5）、界面清晰度（4.5/5）和寫作風(fēng)格（4.5/5）方面獲得了最高分，引用質(zhì)量指標(biāo)的平均分為4.3/5。用戶體驗的平均分為3.9/5，由于采用單GPU部署，響應(yīng)時間得分最低（3.3/5）。內(nèi)容質(zhì)量指標(biāo)方面，寫作風(fēng)格（4.5/5）和事實準(zhǔn)確性（4.3/5）表現(xiàn)出色，而創(chuàng)新性得分最低（2.5/5），這表明該系統(tǒng)擅長生成學(xué)術(shù)規(guī)范的內(nèi)容，但在提出新穎觀點方面稍顯不足。

ScholarCopilot：借助精準(zhǔn)引用訓(xùn)練大語言模型助力學(xué)術(shù)寫作-AI.x社區(qū)

本文轉(zhuǎn)載自??柏企閱文???，作者：柏企

標(biāo)簽

學(xué)術(shù)寫作

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

ICML 2024 | 大語言模型預(yù)訓(xùn)練新前沿：「最佳適配打包」重塑文檔處理標(biāo)準(zhǔn)

輕薄滴假象 ? 3602瀏覽 ? 0回復(fù)
蘋果超強視覺預(yù)訓(xùn)練模型助力下游任務(wù)拿SOTA！（分類、檢測、分割、深度估計）

angel ? 6597瀏覽 ? 0回復(fù)
到底什么是視覺語言模型？(分類/訓(xùn)練/評估)

angel ? 8683瀏覽 ? 0回復(fù)
預(yù)訓(xùn)練大語言模型對時間序列預(yù)測真的有用嗎？去掉預(yù)訓(xùn)練LLM效果反而提升

海因斯DK ? 6313瀏覽 ? 0回復(fù)
一文詳解大語言模型的流行架構(gòu)與訓(xùn)練技術(shù)

angel ? 6156瀏覽 ? 0回復(fù)
2024年以來，學(xué)術(shù)和產(chǎn)業(yè)界的那些SOTA多模態(tài)大模型的架構(gòu)演進之路

angel ? 5836瀏覽 ? 0回復(fù)
更小、更弱，卻更優(yōu)：通過計算最優(yōu)抽樣訓(xùn)練大語言模型推理器

sbf_2000 ? 3526瀏覽 ? 0回復(fù)
如何借助Cortex運行本地LLM

51CTO內(nèi)容精選 ? 3403瀏覽 ? 0回復(fù)
超越SDEdit等七大SOTA，免訓(xùn)練多模態(tài)圖像編輯里程碑：HeadRouter帶來精準(zhǔn)語義調(diào)整

angel ? 3715瀏覽 ? 0回復(fù)
讓大模型寫小說太難？試試雪花十步寫作法，輕松突破瓶頸！

草臺AI ? 8485瀏覽 ? 0回復(fù)
從2D到3D：北大等開源Lift3D，助力精準(zhǔn)具身智能操作！

angel ? 4350瀏覽 ? 0回復(fù)
ChatGPT寫作指南發(fā)布：12個案例助力高效學(xué)習(xí)

云原生AI百寶箱 ? 6285瀏覽 ? 0回復(fù)
尋找樂子人｜ “多語言、精準(zhǔn)定位”上海導(dǎo)游智能體搭建方案

Wordsworth_Jin ? 4015瀏覽 ? 2回復(fù)
4000+實驗揭秘：如何在512個GPU上訓(xùn)練大語言模型？

sbf_2000 ? 3693瀏覽 ? 0回復(fù)
一文讀遍 LoRA 家族：大語言模型高效訓(xùn)練的"秘密武器"

鴻煊的學(xué)習(xí)筆記 ? 4843瀏覽 ? 0回復(fù)
語言與擴散模型的精準(zhǔn)控制

ceesoft ? 2409瀏覽 ? 0回復(fù)
大語言模型的全新預(yù)訓(xùn)練范式-強化預(yù)訓(xùn)練

sbf_2000 ? 2256瀏覽 ? 0回復(fù)
AI LLM 測試提示秘籍：如何精準(zhǔn)評估大語言模型？

Halo咯咯 ? 1440瀏覽 ? 0回復(fù)
Apertus：瑞士首個開源大模型，多語言支持，合規(guī)訓(xùn)練，高效性能

穿越時空111 ? 2369瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

超越 GPT-5!FlowSearch 框架刷新四大基準(zhǔn)，AI 深度研究進入知識流時代 2025-10-24 00:28:39發(fā)布
別讓模型 “瞎標(biāo)”！AI 智能體 + VLM 讓目標(biāo)檢測學(xué)會 “自我糾錯”。mAP 從 72% 飆到 88% 2025-10-14 00:13:53發(fā)布

熱門推薦

超越 GPT-5!FlowSearch 框架刷新四大基準(zhǔn)，AI 深度研究進入知識流時代 0回復(fù)

別再怪AI“聽不懂人話”了，90%的返工和錯誤，都錯在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

關(guān)于RAG系統(tǒng)在多輪對話中的問題改寫(優(yōu)化)方法—使用歷史記錄改寫問題 0回復(fù)

上一篇： 5W字長文 Agent多智能體探秘：架構(gòu)設(shè)計、交互模式與應(yīng)用實踐深度剖析

下一篇：清華大學(xué) | 強化學(xué)習(xí)是否激勵LLM中超越基本模型的推理能力？

社區(qū)精華內(nèi)容

目錄

<nobr id="se0pj"></nobr>

<tt id="se0pj"><b id="se0pj"></b></tt>