AI Coding 的新征途
圍繞 Windsurf 的收購,OpenAI 與 Google 上演商戰(zhàn)大戲。
類似Cursor,Windsurf 也是“AI 編碼助手”。作為 GenAI 潛在的殺手級(jí)應(yīng)用,“AI 編碼助手” 被行業(yè)寄予厚望:
將深刻影響開發(fā)效率、重新定義開發(fā)方式。
AI 編碼助手拖累資深開發(fā)者
然而近期非盈利機(jī)構(gòu) METR的研究【文獻(xiàn)1】卻發(fā)現(xiàn),AI并沒有讓資深開發(fā)者更高效。
METR 基于隨機(jī)對(duì)照試驗(yàn)設(shè)計(jì),對(duì) 16 位經(jīng)驗(yàn)豐富的開源項(xiàng)目開發(fā)者進(jìn)行測(cè)試,每人需完成 246 個(gè)任務(wù)。
開發(fā)者預(yù)估AI 有助提效?20?%,但客觀數(shù)據(jù)顯示:使用如 Cursor Pro + Claude 3.5/3.7 時(shí),平均完成時(shí)間反而延長19%。

主要原因梳理如下:
AI 的建議僅有約 44% 被采納,且大多數(shù)代碼需要逐行復(fù)查與重構(gòu)(約 9% 的總時(shí)間);
在熟悉的復(fù)雜項(xiàng)目中,AI 隨意修改可能引入額外錯(cuò)誤與上下文沖突。
啟發(fā)是,對(duì)資深工程師而言,AI編程助手在處理部分小問題時(shí)有些價(jià)值;
但并未帶來整體效率提升,反而引入更多校對(duì)時(shí)間和認(rèn)知干擾。
哈佛商業(yè)評(píng)論團(tuán)隊(duì)的實(shí)驗(yàn)
對(duì)于 AI 能否重塑軟件開發(fā)工作中的角色和任務(wù)結(jié)構(gòu),哈佛商業(yè)評(píng)論團(tuán)隊(duì)也基于 GitHub Copilot 做過實(shí)驗(yàn)分析【文獻(xiàn)2】。

研究表明:
接入 Copilot 后開發(fā)者減少協(xié)作頻率,更傾向于獨(dú)自完成任務(wù),組織扁平化趨勢(shì)顯現(xiàn);
開發(fā)者側(cè)重進(jìn)行高度探索性思考(如嘗試新框架、實(shí)驗(yàn)新方法),而將具體編碼任務(wù)交由 AI 輔助;
Copilot 對(duì)技術(shù)經(jīng)驗(yàn)較少的開發(fā)者幫助顯著,有助于縮小與資深開發(fā)者之間的能力差距;
原本耗費(fèi)在項(xiàng)目管理、資料搜集、協(xié)調(diào)溝通上的時(shí)間,更多被用到“核心開發(fā)”與“創(chuàng)新思考”上。
研究給出這樣的務(wù)實(shí)建議:為開發(fā)者提供更多“AI?輔助自主塊”,可以讓他們將腦力資源更聚焦在核心設(shè)計(jì)與創(chuàng)新上,提升工作滿意度與創(chuàng)造力。
多Agent協(xié)作開發(fā)模式
來自清華、悉尼大學(xué)等機(jī)構(gòu)的團(tuán)隊(duì),則針對(duì)多 Agent 協(xié)作開發(fā)的模式做了系統(tǒng)化的探索【文獻(xiàn) 3】。
研究構(gòu)建了 ChatDev:一個(gè)協(xié)同工作的“虛擬軟件公司”,由代表多種常見角色的Agent構(gòu)成。
他們通過 Chat Chain 持續(xù)對(duì)話協(xié)作,覆蓋從需求到設(shè)計(jì)、編碼、測(cè)試與文檔的完整開發(fā)流程。

ChatDev具備如下特征:
- 所有 Agent 均基于自然語言通信,避免多模型不一致問題;
- 將大任務(wù)拆分成許多子任務(wù),通過對(duì)話鏈協(xié)作推進(jìn);
- 交流降低幻覺設(shè)計(jì),Agent 在執(zhí)行前會(huì)主動(dòng)提問、澄清需求。
ChatDev 可在少于 7 分鐘、低于 1 美元成本內(nèi)完成一個(gè)五子棋游戲的開發(fā)。
ChatDev 展示了多 Agent 分工協(xié)作遠(yuǎn)超單一 AI 工具的潛力,能顯著改善任務(wù)的連貫性與質(zhì)量;
但其明顯的缺點(diǎn)在于成本高——持續(xù)運(yùn)營多模型 Agent 面臨資源與費(fèi)用挑戰(zhàn)。
機(jī)遇與風(fēng)險(xiǎn)并存
METR強(qiáng)調(diào),當(dāng)前 AI 尚不足以替代專家,但其認(rèn)知緩沖仍深受青睞。
哈佛團(tuán)隊(duì)指出,AI 效果與策略使用關(guān)系緊密,若設(shè)計(jì)得當(dāng),能夠釋放研發(fā)潛力。
ChatDev 則顯示,AI 群體合作可提升結(jié)構(gòu)化任務(wù)效率,但需克服資源瓶頸。
從單一 AI 輔助到 AI 改變工作方式,再到 AI Agent 協(xié)作,各具挑戰(zhàn)與適用場(chǎng)景。
這里,筆者看到一條AI Coding 的新征途:任務(wù)原子化,把“寫代碼”拆成“說話”;認(rèn)知外包,用 AI 代理擴(kuò)展“個(gè)人帶寬”;多代理協(xié)作,讓 AI 之間先“吵”出共識(shí)??偨Y(jié)一句話,語言即編譯器,自然語言成為最高抽象,把軟件工程變成一場(chǎng)多代理的“語言游戲”。
文獻(xiàn)1, Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity, https://arxiv.org/abs/2507.09089
文獻(xiàn) 2, Generative AI and the Nature of Work,https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5007084
文獻(xiàn) 3, ChatDev: Communicative Agents for Software Development ,https://arxiv.org/html/2307.07924v5
本文轉(zhuǎn)載自?????????????清熙?????????,作者:王慶法

















