偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

開源即登榜!登頂全球前十AI編程智能體,UCL初創(chuàng)團隊開源Prometheus

人工智能 新聞
學(xué)界殺入主賽道!UCL 校園團隊 EuniAI 拋出開源智能體 Prometheus,在 SWE-bench Verified 上 71.2% Pass@1、主榜實錘合并;成本低至 $0.23/issue。

來自倫敦大學(xué)學(xué)院(UCL)的初創(chuàng)團隊EuniAI開源發(fā)布了AI軟件智能體Prometheus。

該系統(tǒng)在SWE-bench Verified上取得71.2%的Pass@1成功率,成績已被官方確認并合并至主榜單。

令人矚目的是,這一成果來自高校科研團隊,卻已與產(chǎn)業(yè)巨頭同臺競技,展現(xiàn)出學(xué)術(shù)研發(fā)在AI工程領(lǐng)域的產(chǎn)業(yè)級突破。

從學(xué)術(shù)論文到全球榜單

高??蒲械摹府a(chǎn)業(yè)級突破」

Prometheus源自論文:

論文地址:https://arxiv.org/abs/2507.19942

開源代碼:https://github.com/EuniAI/Prometheus

官網(wǎng)Demo:https://euni.ai/

官方榜單確認:https://github.com/SWE-bench/experiments/pull/339

它不僅通過開源代碼和Neo4J知識圖譜技術(shù),讓AI「讀懂代碼」,還能在實際GitHub項目中實現(xiàn)自動修復(fù)錯誤、驗證補丁,甚至生成可直接提交的修復(fù)說明。

??全球榜單:成績亮眼

  • SWE-bench Verified:71.2% Pass@1(官方確認 merge)
  • SWE-bench Lite:35.33% Pass@1(開源模型SOTA)
  • 平均API成本:僅$0.23/issue

技術(shù)亮點:讓AI真正「理解」代碼結(jié)構(gòu)

Prometheus的突破在于:它不是提示工程的產(chǎn)物,而是圖結(jié)構(gòu)推理的系統(tǒng)性設(shè)計。

統(tǒng)一知識圖譜(Unified Knowledge Graph)將代碼結(jié)構(gòu)整合文件結(jié)構(gòu)、AST抽象語法樹和文檔信息,將復(fù)雜代碼庫轉(zhuǎn)化為可推理的知識網(wǎng)絡(luò),實現(xiàn)多語言語法理解與跨文件依賴分析。

多智能體協(xié)作框架(Multi-Agent System)包含六個專職Agent,從問題分類、環(huán)境重現(xiàn)到補丁生成與驗證,實現(xiàn)端到端自動化開發(fā)閉環(huán)。

跨語言與可擴展性覆蓋Python、Java、Rust、C/C++、Go、TypeScript、PHP、Ruby等主流語言,支持真實世界項目自動構(gòu)建與測試。

低成本+高可復(fù)現(xiàn)性 Prometheus使用DeepSeek-V3模型,性能與GPT-4o相近,但成本僅為其1/9。支持在筆記本級硬件上運行完整修復(fù)流程。

在線Demo

從論文到真實工程的橋梁

為展示Prometheus的工程化能力,EuniAI團隊在官網(wǎng)上線了交互式演示平臺:??https://euni.ai/

該平臺支持用戶直接連接項目,選擇待修復(fù)任務(wù),系統(tǒng)將自動完成以下全自動流程操作:

  1. 自動環(huán)境構(gòu)建與依賴安裝
  2. 問題分析與知識圖譜檢索
  3. 補丁生成與自動驗證
  4. 結(jié)果可視化與差異對比(Diff View)

目前Demo版本支持Python與多語言項目,提供限量邀請碼注冊體驗,并持續(xù)向?qū)W術(shù)機構(gòu)與開發(fā)者開放內(nèi)測合作。

我們希望AI不再只是「補代碼」,而是理解項目結(jié)構(gòu)、能獨立調(diào)試和修復(fù)的工程伙伴。  ——EuniAI團隊

EuniAI團隊由UCL助理教授葉荷(HeYe)領(lǐng)銜,成員來自倫敦大學(xué)學(xué)院、KTH皇家理工學(xué)院和CMU等國際高校。

他們以「科研與開源并行」的方式,推動AI智能體真正落地,讓學(xué)術(shù)創(chuàng)新真正服務(wù)于軟件開發(fā)一線。

未來展望

EuniAI團隊對下一代智能代碼分析與自動修復(fù)系統(tǒng)的展望:

「Prometheus的愿景,是讓AI不僅寫代碼、修代碼,更能理解整個軟件生態(tài),并與人類工程師共同進化?!?/span>

未來,EuniAI團隊計劃讓Prometheus擁有更強的「工程意識」:

  • 智能修復(fù)代理(Issue Resolution Agent):自動檢測、修復(fù)并提交補丁,實現(xiàn)端到端自動化修復(fù)。
  • 知識圖譜生成(Codebase → Graph):一鍵將代碼庫結(jié)構(gòu)化,提升上下文檢索與跨語言理解。
  • 項目記憶與學(xué)習(xí)(Agent Memory + Post-Train Model):讓智能體具備項目經(jīng)驗與長期記憶,不斷自我優(yōu)化。
  • 自動構(gòu)建與驗證(Automated Build Agent):生成補丁后自動測試與驗證,保障修復(fù)質(zhì)量。
  • 生態(tài)集成(MCP & TerminalAutomation):支持Model Context Protocol與終端自動化,構(gòu)建完整的AI工程流水線。

Prometheus不止是一款智能體系統(tǒng),它是下一代代碼理解與自動修復(fù)平臺的起點。

??立即體驗Demo!

??https://euni.ai/

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2025-05-08 09:31:50

2025-06-03 08:09:00

AI智能體模型

2025-05-30 06:48:53

2025-09-24 09:02:42

2025-05-22 06:59:53

2025-10-09 11:36:57

2023-07-22 13:09:51

模型開源

2025-07-02 08:50:00

AI智能體模型

2021-10-20 11:12:49

工具代碼開發(fā)

2024-10-15 17:28:05

2025-02-26 14:00:00

開源模型數(shù)據(jù)

2025-08-26 09:10:00

2024-04-15 12:28:00

AI模型

2025-09-03 00:45:00

2018-02-08 09:25:08

開源AI項目

2024-03-18 14:17:06

大模型開源人工智能

2025-05-07 13:57:05

谷歌I/O版視覺

2020-12-07 16:14:40

GitHub 技術(shù)開源

2025-03-03 11:16:18

點贊
收藏

51CTO技術(shù)棧公眾號