偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

黃仁勛預(yù)言成真!AI智能體成GitHub主力,一天頂人類(lèi)一年

人工智能 新聞
「軟件正在吞噬世界,但AI將吞噬軟件?!埂ミ_(dá)CEO黃仁勛的預(yù)言正加速照進(jìn)現(xiàn)實(shí)。

最近,來(lái)自加拿大女王大學(xué)的一項(xiàng)最新研究,首次揭示了AI編程智能體如何大規(guī)模滲透開(kāi)源社區(qū)。

圖片

論文地址:https://arxiv.org/abs/2507.15003

數(shù)據(jù)集地址:https://huggingface.co/datasets/hao-li/AIDev

代碼地址:https://github.com/SAILResearch/AI_Teammates_in_SE3

研究團(tuán)隊(duì)通過(guò)分析45.6萬(wàn)條GitHub Pull Request(PR,代碼修改請(qǐng)求)發(fā)現(xiàn),OpenAI Codex、GitHub Copilot和Claude Code等AI編程智能體已超越簡(jiǎn)單的代碼補(bǔ)全角色,正作為真正的「AI程序員」活躍在開(kāi)源一線:

它們能獨(dú)立發(fā)起PR、參與評(píng)審,甚至與人類(lèi)開(kāi)發(fā)者就修改方案展開(kāi)「討論」。

這標(biāo)志著軟件工程正式邁入知名AI科學(xué)家Andrej Karpathy所預(yù)言的3.0時(shí)代—AI從工具升級(jí)為協(xié)作伙伴,全球已有超過(guò)6.1萬(wàn)個(gè)開(kāi)源項(xiàng)目開(kāi)始接納AI編程智能體作為「同事」。

圖片

這些項(xiàng)目涵蓋各種規(guī)模,使用者包括4.7萬(wàn)名人類(lèi)開(kāi)發(fā)者。

其中,OpenAI Codex表現(xiàn)最為活躍,提交PR達(dá)41萬(wàn)次(截止發(fā)文已達(dá)到80萬(wàn)次),堪稱(chēng)「卷王」;Devin和GitHub Copilot分別以2.4萬(wàn)和1.6萬(wàn)次提交緊隨其后。

效率爆炸:3天干完3年的活

AI編程智能體帶來(lái)的效率提升令人咋舌。數(shù)據(jù)顯示,GitHub Copilot平均僅需13分鐘就能完成一個(gè)代碼修改請(qǐng)求的核心工作,遠(yuǎn)快于人類(lèi)開(kāi)發(fā)者通常所需的數(shù)小時(shí)甚至數(shù)天。

圖片


更極端的案例顯示,一位開(kāi)發(fā)者借助OpenAI Codex在短短3天內(nèi)提交了164次代碼修改,幾乎相當(dāng)于他過(guò)去3年(提交176次)的工作總量。

這如同為每位程序員配備了100個(gè)不知疲倦的實(shí)習(xí)生,他們可以24小時(shí)不間斷地產(chǎn)出代碼。

質(zhì)量困境:快不等于好

研究揭示了一個(gè)關(guān)鍵矛盾:AI代碼的接受率普遍低于人類(lèi)。

OpenAI Codex的代碼合并率為65%,GitHub Copilot僅為38%,而人類(lèi)開(kāi)發(fā)者平均達(dá)到76%。

這種差距在核心功能開(kāi)發(fā)中尤為明顯:在核心功能開(kāi)發(fā)(feat)和缺陷修復(fù)(fix)任務(wù)中,差距尤為顯著(低15-40個(gè)百分點(diǎn))。

圖片

不過(guò),AI在文檔編寫(xiě)(docs)方面展現(xiàn)出獨(dú)特優(yōu)勢(shì)。OpenAI Codex的文檔類(lèi)修改接受率高達(dá)88.6%,顯著超過(guò)人類(lèi)的76.5%。研究推測(cè),文檔生成更依賴語(yǔ)言能力而非復(fù)雜邏輯推理,這正契合當(dāng)前大語(yǔ)言模型的核心優(yōu)勢(shì)。

更具啟發(fā)性的現(xiàn)象是,高達(dá)37%的GitHub Copilot PR經(jīng)歷了「人機(jī)聯(lián)合評(píng)審」——AI工具進(jìn)行初步篩查后,再由人類(lèi)把關(guān)。

圖片

然而,新模式也引發(fā)擔(dān)憂:研究發(fā)現(xiàn),Copilot提交的代碼通常由其「同門(mén)」AI 智能體(copilot-swe-agent[bot])初審,存在「自己人審自己人」的潛在審查盲點(diǎn)。研究團(tuán)隊(duì)建議,未來(lái)應(yīng)探索建立更獨(dú)立的評(píng)審機(jī)制以保障公正性。

未來(lái)已來(lái):GitHub進(jìn)化為AI訓(xùn)練場(chǎng)

研究預(yù)言,開(kāi)源平臺(tái)將進(jìn)化為AI智能體的「訓(xùn)練健身房」。每一次成功的代碼合并將成為強(qiáng)化學(xué)習(xí)的「正反饋」,每一次測(cè)試失敗或PR被拒則是寶貴的「負(fù)反饋」。

其終極目標(biāo)是培育出能獨(dú)立、可靠完成軟件迭代的成熟AI程序員。

基于海量實(shí)證數(shù)據(jù),研究團(tuán)隊(duì)為AI編程智能體時(shí)代勾勒出關(guān)鍵發(fā)展方向:

1. 動(dòng)態(tài)評(píng)測(cè)體系:摒棄傳統(tǒng)的靜態(tài)測(cè)試,直接在真實(shí)項(xiàng)目環(huán)境中評(píng)估AI表現(xiàn)

2. 失敗模式解析:深入分析被拒PR,建立AI常見(jiàn)錯(cuò)誤庫(kù),驅(qū)動(dòng)改進(jìn)

3. 延遲優(yōu)化:重點(diǎn)解決部分任務(wù)響應(yīng)超時(shí)(>1小時(shí))的長(zhǎng)尾問(wèn)題。

4. 評(píng)審減負(fù):讓AI生成的代碼更清晰、更易審查,降低人類(lèi)負(fù)擔(dān)

5. 專(zhuān)業(yè)評(píng)審AI:開(kāi)發(fā)專(zhuān)門(mén)用于代碼審查的智能體

6. 智能評(píng)審分流: 根據(jù)代碼復(fù)雜度與風(fēng)險(xiǎn)自動(dòng)分配評(píng)審資源

7. 全周期質(zhì)量追蹤:監(jiān)控AI生成代碼的長(zhǎng)期維護(hù)成本和缺陷率

8. 需求理解:提升AI對(duì)不明確任務(wù)意圖的理解與規(guī)劃能力

9. 編程語(yǔ)言優(yōu)化:針對(duì)TypeScrip等AI擅長(zhǎng)語(yǔ)言進(jìn)行深度適配,或開(kāi)發(fā)出AI專(zhuān)用新語(yǔ)言

「這并非取代人類(lèi)開(kāi)發(fā)者,而是重新定義開(kāi)發(fā)者的核心角色,未來(lái)的程序員將更像交響樂(lè)團(tuán)的指揮家,專(zhuān)注于戰(zhàn)略目標(biāo)設(shè)定、協(xié)調(diào)多個(gè)‘AI樂(lè)手’的協(xié)作,而非親自演奏每一個(gè)音符?!?/span>

隨著AI編程智能體數(shù)量和能力呈指數(shù)級(jí)增長(zhǎng),軟件工程行業(yè)正站在深刻變革的臨界點(diǎn)。這場(chǎng)革命將如何重塑開(kāi)發(fā)流程、團(tuán)隊(duì)協(xié)作乃至行業(yè)生態(tài),值得我們持續(xù)關(guān)注與思考。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2023-03-22 08:14:03

英偉達(dá)人工智能

2016-10-28 11:29:26

NVIDIA

2023-03-08 10:07:20

2025-10-17 09:03:10

2024-08-15 11:58:01

2023-08-09 17:47:40

黃仁勛計(jì)算機(jī)NVIDIA

2025-04-25 08:55:00

2023-11-30 08:32:52

人工智能AGI

2009-04-10 08:26:48

芯片廠商薪酬黃仁勛

2013-04-03 10:17:15

Intel黃仁勛CEO

2023-11-28 14:00:00

模型數(shù)據(jù)

2017-02-15 16:28:15

商用電腦

2025-04-16 09:41:46

2023-08-16 13:47:42

AI機(jī)器

2025-01-09 12:21:31

2023-12-04 10:00:05

Meta人工智能

2024-10-25 16:50:01

2016-09-20 11:15:18

NVIDIA

2024-07-03 12:15:01

2024-03-11 07:00:00

英偉達(dá)預(yù)測(cè)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)