偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

“AI版LeCun”自己講解論文,自我進(jìn)化智能體框架生成精美演講視頻

人工智能 新聞
加州大學(xué)圣塔芭芭拉(UCSB)與圣克魯茲(UCSC)的研究者提出EvoPresent,一個(gè)能夠自我進(jìn)化的學(xué)術(shù)演講智能體框架,讓AI不僅能“講清楚論文”,還能“講得好看”。

AI自己講明白論文,還能生成更美觀的幻燈片。

加州大學(xué)圣塔芭芭拉(UCSB)與圣克魯茲(UCSC)的研究者提出EvoPresent,一個(gè)能夠自我進(jìn)化的學(xué)術(shù)演講智能體框架,讓AI不僅能“講清楚論文”,還能“講得好看”。

從邏輯到審美:科研演講自動(dòng)化的瓶頸

盡管已有很多系統(tǒng)能將論文自動(dòng)轉(zhuǎn)化為幻燈片或海報(bào),但它們?nèi)源嬖谌缶窒蓿?/span>

敘事單一、設(shè)計(jì)僵化、缺乏反饋。

AI往往沿用論文結(jié)構(gòu)機(jī)械提煉內(nèi)容,講述缺乏起伏;模板化設(shè)計(jì)又難適配不同風(fēng)格,常出現(xiàn)色彩沖突、排版擁擠等問題;生成過(guò)程一旦結(jié)束,系統(tǒng)便無(wú)法判斷“哪里不美”,更談不上自我修正。 這些不足讓AI演講顯得冷漠機(jī)械,難以兼顧邏輯與美感。

EvoPresent正是在此提出新的路徑,讓AI像人類講者一樣,在生成中反思,在反思中進(jìn)化。

多智能體協(xié)作:讓AI成為一個(gè)“演講團(tuán)隊(duì)

EvoPresent由四個(gè)智能體組成:Storyline Agent構(gòu)建敘事邏輯,

Scholar Agent豐富內(nèi)容與可視化,Design Agent負(fù)責(zé)排版與渲染,Checker Agent基于美學(xué)模型評(píng)估并反饋。 它們?cè)凇安莞濉答仭拚钡难h(huán)中協(xié)同工作,使AI具備自我改進(jìn)能力,從而生成兼具邏輯與美感的學(xué)術(shù)演講。

PresAesth:讓AI懂設(shè)計(jì)的美

EvoPresent的核心是美學(xué)模型PresAesth,這是一個(gè)基于多任務(wù)強(qiáng)化學(xué)習(xí)(Multi-task RL)的模型,用來(lái)模擬人類的審美判斷。

它同時(shí)執(zhí)行三項(xiàng)任務(wù):

  • 美學(xué)評(píng)分:為幻燈片生成1–10分的視覺得分;
  • 缺陷識(shí)別:發(fā)現(xiàn)布局、留白、字體比例等問題并給出解釋性反饋;
  • 版本比較:判斷多種設(shè)計(jì)中哪一個(gè)更具美感。

研究者采用了Group Relative Policy Optimization (GRPO)算法,通過(guò)人類偏好數(shù)據(jù)訓(xùn)練模型,使其能在反饋中逐步形成可解釋的審美推理。與傳統(tǒng)監(jiān)督學(xué)習(xí)不同,這種方式讓模型不僅會(huì)“打分”,還能說(shuō)明原因,如“標(biāo)題層級(jí)不清晰”“文字與圖像間距不足”。

EvoPresent Benchmark:學(xué)術(shù)演講的“美學(xué)標(biāo)準(zhǔn)”

為了讓AI“學(xué)會(huì)好看”,團(tuán)隊(duì)構(gòu)建了首個(gè)系統(tǒng)化評(píng)測(cè)體系——EvoPresent Benchmark。它由兩個(gè)部分組成:

第一部分Presentation Generation Quality,收錄650篇來(lái)自NeurIPS、ICLR、CVPR等頂會(huì)的論文,覆蓋幻燈片、講稿、視頻等多模態(tài)形式,從敘事流暢性、布局平衡、美學(xué)分?jǐn)?shù)等多個(gè)維度評(píng)估自動(dòng)生成質(zhì)量。

第二部分Aesthetic Awareness Dataset,包含2000對(duì)人工標(biāo)注的幻燈片樣本,通過(guò)不同程度的視覺擾動(dòng)(如調(diào)整留白、色彩或版式)生成對(duì)比樣本,用于訓(xùn)練與驗(yàn)證美學(xué)評(píng)估能力。

這一框架使AI的視覺表達(dá)有了可量化的標(biāo)準(zhǔn),也讓演講生成的“美學(xué)進(jìn)化”可以被系統(tǒng)性衡量。

實(shí)驗(yàn)結(jié)果:AI正在學(xué)會(huì)反思

在實(shí)驗(yàn)中,研究者將EvoPresent與多種主流方法進(jìn)行了對(duì)比,包括GPT-4o、Claude 4、DeepSeek-R1等端到端模型,以及PresentAgent、Paper2Poster等多智能體系統(tǒng)。結(jié)果表明,EvoPresent在內(nèi)容連貫性與視覺設(shè)計(jì)兩方面均取得顯著提升。

更重要的發(fā)現(xiàn)是,模型的自我提升能力與規(guī)模無(wú)關(guān),而與反饋質(zhì)量高度相關(guān)。

即使使用輕量模型(如GPT-4o),只要有高質(zhì)量審美反饋,系統(tǒng)也能在三輪迭代內(nèi)將視覺評(píng)分從3.2提升至8.0。這意味著AI的“反思機(jī)制”比單純的算力擴(kuò)張更關(guān)鍵。

從自動(dòng)化到藝術(shù)化:科研傳播的新拐點(diǎn)

EvoPresent展示了一種全新的科研傳播范式,讓AI成為“自我改進(jìn)的講述者”。

它將論文解讀、敘事構(gòu)建、視覺設(shè)計(jì)與美學(xué)評(píng)價(jià)融為一體,使自動(dòng)化生成不再止步于信息復(fù)述,而能在形式與內(nèi)容間尋求新的平衡。

這種理念的意義不僅在于節(jié)省時(shí)間,更在于重塑科研表達(dá)的美學(xué)標(biāo)準(zhǔn)。未來(lái),上傳論文或許意味著自動(dòng)生成一場(chǎng)完整的“AI講演”:幻燈片、配音、視頻皆由系統(tǒng)完成,并根據(jù)會(huì)議風(fēng)格與受眾特征自動(dòng)調(diào)整設(shè)計(jì)風(fēng)格。正如論文標(biāo)題所言,“Presenting a Paper is an Art.”

EvoPresent讓AI真正開始學(xué)習(xí)這門藝術(shù),不僅理解邏輯,更理解“美”。

Project Page: https://evopresent.github.io
arXiv: arXiv:2510.05571


責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2025-10-22 09:00:00

2024-06-13 09:20:26

2025-07-31 02:00:00

智能體Agent人工超級(jí)智能

2025-07-04 16:46:57

智能體模型AI

2024-11-14 14:50:00

AI智能體

2025-03-10 09:15:00

2025-06-03 08:09:00

AI智能體模型

2024-10-28 14:05:00

2021-02-07 10:01:31

AI 數(shù)據(jù)人工智能

2025-08-18 09:08:00

2022-06-21 14:08:25

AIGitHub模仿人類

2025-06-16 14:40:40

模型AI訓(xùn)練

2025-06-03 09:14:00

2018-06-28 22:04:25

智能體華為云人工智能

2024-11-08 09:20:00

2017-11-22 09:22:00

AI智能機(jī)器學(xué)習(xí)

2025-06-30 05:30:00

2024-10-21 12:40:00

視頻生成模型

2025-09-11 13:46:59

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)