日本AI王者,CTO是Transformer之父,剛拿下世界編程競賽冠軍
今年的國際編程競賽ICFP(International Conference on Functional Programming)的冠軍隊(duì)伍名為「Team Unagi」,團(tuán)隊(duì)來自日本初創(chuàng)AI研究公司Sakana AI,其中的AI系統(tǒng)不僅幫助他們加速解決方案,更為人類隊(duì)友帶來了全新的解題思路。

ICFP 2025編程大賽高度開放,「任何手段皆可」,鼓勵(lì)各路奇思妙想和工具(包括AI)自由登場。
Sakana AI團(tuán)隊(duì)選擇了一條獨(dú)特的「人機(jī)共創(chuàng)」道路。
在這場要求參賽者利用有限線索探索迷宮結(jié)構(gòu)的競賽中,人類開發(fā)者與AI算法并肩作戰(zhàn),譜寫了一出科技與智慧交融的精彩戲碼。
與此同時(shí),Sakana AI近期將融資1億美元,估值將達(dá)25億美元。
人類策略遇上瓶頸
AI進(jìn)化來破局
參賽者需要根據(jù)模糊提示,用最少的詢問次數(shù)勾勒出一個(gè)未知迷宮的全貌。

Sakana AI團(tuán)隊(duì)起初采用的是一個(gè)頗具創(chuàng)意但復(fù)雜的方案:將迷宮問題轉(zhuǎn)化為邏輯約束,使用SAT求解器(布爾可滿足性問題求解器)來一次性算出符合所有條件的解。
這種策略理論上可以充分利用有限線索,提高解題效率。
然而,正如團(tuán)隊(duì)所料,方案的瓶頸也隨之而來:SAT求解器的性能高度依賴于問題編碼的質(zhì)量。
編碼得當(dāng),求解器才能高效工作;編碼不佳,再簡單的問題也可能算不出結(jié)果。
如何設(shè)計(jì)高效的編碼既需要深厚洞見,又免不了反復(fù)試錯(cuò)。

邏輯公式的一個(gè)示例。SAT問題的目標(biāo)是找到一個(gè)能滿足這些公式的變量賦值
盡管隊(duì)內(nèi)一位成員精心構(gòu)造了初始的邏輯公式,仍發(fā)現(xiàn)隨著迷宮規(guī)模增大,求解器耗時(shí)呈爆炸式增長,成為制約進(jìn)度的性能瓶頸。
就在團(tuán)隊(duì)絞盡腦汁試圖優(yōu)化代碼時(shí),他們把目光投向了自家研發(fā)的AI工具——一個(gè)名為ShinkaEvolve的進(jìn)化式代碼優(yōu)化框架。
Shinka在日語中意為「進(jìn)化」,這個(gè)開源框架不負(fù)其名:它能夠利用大型語言模型(LLM)來不斷「進(jìn)化」代碼,以優(yōu)化算法性能。
Sakana AI團(tuán)隊(duì)決定讓ShinkaEvolve試一試,替他們來攻克SAT編碼的難關(guān)。
他們將團(tuán)隊(duì)原本用Rust語言編寫的迷宮SAT求解代碼交給ShinkaEvolve,并設(shè)置計(jì)算開銷(求解器運(yùn)行時(shí)間)為需要最小化的目標(biāo)函數(shù),讓AI自主改進(jìn)代碼。
演化算法遇上生成式AI
ShinkaEvolve的工作原理頗有幾分「遺傳算法+人工智能教練」的味道。
它先生成一批代碼改寫候選,對(duì)每個(gè)候選運(yùn)行測試評(píng)估性能,然后優(yōu)勝劣汰、融合改進(jìn),生成新一代的代碼版本,再重復(fù)這個(gè)循環(huán)。

ShinkaEvolve框架示意圖
ShinkaEvolve并非盲目地隨機(jī)修改代碼,它由一組大型語言模型共同驅(qū)動(dòng),相當(dāng)于給進(jìn)化算法配備了「AI大腦」,能夠基于已有的編程知識(shí)與上下文智能地產(chǎn)生有潛力的改進(jìn)方案。
這種結(jié)合了生成式AI和進(jìn)化式探索的方法,被視為Sakana AI的核心技術(shù)靈感之一,讓AI從自然進(jìn)化中汲取靈感,像生物進(jìn)化那樣不斷試錯(cuò),但又借助強(qiáng)大的預(yù)訓(xùn)練模型作為「經(jīng)驗(yàn)指導(dǎo)」,從而大幅提高探索效率。
ShinkaEvolve框架示意圖:AI通過迭代試錯(cuò)來進(jìn)化優(yōu)化程序代碼。左側(cè)由人類提供初始代碼和問題評(píng)估器,中間AI生成變種代碼進(jìn)行性能測試,右側(cè)不斷篩選出更優(yōu)方案。整套流程如同「人工智能的進(jìn)化論實(shí)驗(yàn)」。
ShinkaEvolve在此次迷宮挑戰(zhàn)中的表現(xiàn)堪稱一場精彩的進(jìn)化實(shí)驗(yàn)。
根據(jù)團(tuán)隊(duì)公布的數(shù)據(jù),他們讓AI對(duì)代碼進(jìn)行了約320次迭代嘗試,耗費(fèi)的云端算力成本僅約60美元。
隨著每一代代碼的演進(jìn),求解速度穩(wěn)步提升,中途還出現(xiàn)了幾次「靈感大爆發(fā)」式的重大躍升。

每一代的得分都會(huì)提升,并且在此過程中可以看到幾個(gè)顯著的突破
最終,AI產(chǎn)出的一版優(yōu)化代碼令性能實(shí)現(xiàn)了飛躍式增長:
針對(duì)中等規(guī)模的迷宮(18個(gè)房間),代碼運(yùn)行時(shí)間從原來的2.86秒縮短到0.44秒,加速約6.5倍;而在大型迷宮(24個(gè)房間)上,執(zhí)行時(shí)間更是從127秒驟降至13秒,提升近10倍!

這意味著許多原本因耗時(shí)過長而「遙不可及」的更大規(guī)模問題,如今在可接受的時(shí)間內(nèi)也能解決了。
Sakana AI團(tuán)隊(duì)立刻將這份AI優(yōu)化產(chǎn)物整合進(jìn)了他們的最終參賽方案里,大幅提高了解題效率和成績。
Sakana AI團(tuán)隊(duì)參賽過程中使用的源代碼和Prompt也已開源:https://github.com/icfpc-unagi/icfpc2025
AI不僅提速
更帶來人類未及的創(chuàng)意
性能飆升帶來了勝利的希望,而更出乎意料的是,AI在優(yōu)化過程中學(xué)到的「竅門」反過來啟發(fā)了人類。
團(tuán)隊(duì)發(fā)現(xiàn),ShinkaEvolve給代碼動(dòng)的很多「手術(shù)」其實(shí)都帶有深刻洞見。
例如,其中最關(guān)鍵的一項(xiàng)改進(jìn)涉及迷宮連接關(guān)系的表示方式。
原本人類編碼直接將「房間A的門1連接房間B的門2」硬編碼為約束,而AI卻引入了一個(gè)巧妙的中間變量,將關(guān)系拆分為「兩步」:先標(biāo)記「房間A的門1連接到了房間B」,再進(jìn)一步細(xì)化具體是B的哪扇門。
這個(gè)額外的抽象層次讓求解器可以先在更高層面決定「哪些房間相連」,再著手處理具體門對(duì)門的對(duì)應(yīng)關(guān)系,從而大大降低了搜索難度。
這一點(diǎn)石成金的輔助變量策略,本質(zhì)上是一條具有普適性的建模原則。
團(tuán)隊(duì)成員們恍然大悟,甚至在后續(xù)解決其他難題時(shí)也手動(dòng)借鑒了同樣的思路,可謂AI教學(xué)、人類受益。
更重要的是,這次「AI發(fā)現(xiàn)→人類領(lǐng)悟」的良性循環(huán)絕非曇花一現(xiàn)。
Sakana AI團(tuán)隊(duì)總結(jié)道,他們成功實(shí)踐了一種人機(jī)協(xié)作的新范式:
人類擅長制定整體戰(zhàn)略、搭建初始解決方案,而AI則在此框架內(nèi)進(jìn)行定向、密集的搜索優(yōu)化,挖掘出人類可能忽略的改進(jìn)空間。隨后,人類對(duì)AI產(chǎn)出的成果進(jìn)行分析提煉,將其中的洞見融會(huì)貫通,再用于新的挑戰(zhàn)。
這樣的合作關(guān)系使得AI不再只是冰冷的工具,而儼然成為科研團(tuán)隊(duì)中的一位「頭腦風(fēng)暴」伙伴。
此次ICFP項(xiàng)目的成功正是建立在這種互補(bǔ)互助的模式之上。
它預(yù)示著未來解決復(fù)雜問題的一種強(qiáng)大范式:人機(jī)攜手,各展所長。
Sakana AI
從自然中汲取靈感的AI新銳
這場在編程競賽中的亮眼表現(xiàn)背后,是一家年輕卻雄心勃勃的AI研究公司:Sakana AI。
Sakana在日語中意為「魚」,該公司的Logo正是由一群魚組成的圖案,其中一條紅色小魚逆向游動(dòng),象征著勇于打破常規(guī)、特立獨(dú)行。

這個(gè)名字和標(biāo)志背后折射出Sakana AI的技術(shù)哲學(xué):從大自然汲取智慧,追求群體智能和進(jìn)化等自然啟示,同時(shí)不盲從當(dāng)下主流,而是大膽探索AI發(fā)展的下一程。
Sakana AI于2023年在日本東京創(chuàng)立,短短時(shí)間已匯聚了一支星光熠熠的創(chuàng)始團(tuán)隊(duì)。
公司由前谷歌大腦研究科學(xué)家David Ha、Transformer架構(gòu)共同作者Llion Jones、前日本首家獨(dú)角獸Mercari歐洲分部CEO伊藤錬(Ren Ito)聯(lián)合創(chuàng)立,分別擔(dān)任CEO、CTO、COO。
David Ha以在谷歌大腦開展前沿創(chuàng)意研究聞名,轉(zhuǎn)投AI之前曾是高盛的交易員;Llion Jones則是機(jī)器學(xué)習(xí)史上里程碑論文「Attention is All You Need」(Transformer模型)的合著者之一。
Ren Ito也在加入Sakana AI前曾擔(dān)任Stability AI的COO。
此外,創(chuàng)始團(tuán)隊(duì)成員也有來自谷歌DeepMind等機(jī)構(gòu)的資深研究人士。
這樣的豪華陣容,加上對(duì)理念的堅(jiān)持,使Sakana AI在成立之初便獲得了頂級(jí)投資機(jī)構(gòu)的青睞。
2024年初公司宣布完成3000萬美元種子輪融資,由美國硅谷的Lux Capital和Khosla Ventures領(lǐng)投,多家日本本土巨頭企業(yè)也參與其中。
而公司的A輪融資達(dá)約2億美元,股東中包括英偉達(dá),并官宣與英偉達(dá)的合作。
目前,Sakana AI的估值約15億美元。
顯然,資本市場也在寄望這支「AI鯰魚」來攪動(dòng)行業(yè)風(fēng)潮。
技術(shù)愿景:進(jìn)化智能,開拓AI新范式
Sakana AI的愿景可用一句話概括:以自然為師,開創(chuàng)AI新范式。
與當(dāng)下諸多公司熱衷于追逐超大規(guī)模Transformer模型不同,Sakana AI立志開發(fā)的是從自然機(jī)制中獲得啟發(fā)的新型基礎(chǔ)模型。
正如其投資方所評(píng)價(jià)的那樣:
如今大多數(shù)AI團(tuán)隊(duì)還在沿用昨天的Transformer架構(gòu),拼命擴(kuò)大參數(shù)規(guī)模,而Sakana AI已經(jīng)在探索進(jìn)化和復(fù)雜自適應(yīng)系統(tǒng)啟發(fā)的下一代基礎(chǔ)模型。
Sakana AI的研究范式強(qiáng)調(diào)「開放式進(jìn)化」和「持續(xù)自我改進(jìn)」。
他們希望構(gòu)建出的AI系統(tǒng)不再像傳統(tǒng)模型那樣訓(xùn)練完畢就固化不變,而是能像生物一樣在運(yùn)行中不斷學(xué)習(xí)、優(yōu)化,甚至改寫自身代碼,實(shí)現(xiàn)無終止的進(jìn)化。
這一理念聽起來近乎科幻,卻有堅(jiān)實(shí)的學(xué)術(shù)根基可循。
早在上世紀(jì),AI研究者就提出過能自我修改代碼、不斷學(xué)習(xí)提高的「哥德爾機(jī)」(一種理論上的自我完善AI)構(gòu)想。
不過哥德爾機(jī)要求AI在改自己代碼前能證明這一定會(huì)帶來優(yōu)化,實(shí)操上難以實(shí)現(xiàn)。
Sakana AI的團(tuán)隊(duì)則另辟蹊徑,與學(xué)界合作提出了一個(gè)更可行的框架,巧妙地引入「達(dá)爾文式進(jìn)化」的思路:讓AI不停嘗試修改自身,通過實(shí)驗(yàn)驗(yàn)證哪些改動(dòng)能提升性能,然后保留優(yōu)勝劣汰,周而復(fù)始地自我強(qiáng)化。
這一系統(tǒng)稱為「達(dá)爾文-哥德爾機(jī)」(Darwin G?del Machine, DGM),團(tuán)隊(duì)在技術(shù)報(bào)告中展示了其雛形:一個(gè)能改進(jìn)自身代碼的編程智能體。

https://arxiv.org/abs/2505.22954
DGM利用預(yù)訓(xùn)練的基礎(chǔ)模型來提議代碼改進(jìn),再通過開放式的進(jìn)化算法在龐大的程序版本庫中搜索更優(yōu)解。
實(shí)驗(yàn)結(jié)果表明,這種AI算力越充足就越聰明,性能隨著自我改寫次數(shù)的增加不斷提升,甚至超越了由人類手工設(shè)計(jì)的傳統(tǒng)算法。
可以看出,無論是此次ICFP競賽中的ShinkaEvolve,還是「達(dá)爾文-哥德爾機(jī)」概念,Sakana AI始終圍繞著一個(gè)核心理念在探索:讓AI像生命體一樣進(jìn)化。
這種范式突破了經(jīng)典AI的桎梏,將生成式AI的強(qiáng)大直覺與進(jìn)化算法的求異探索結(jié)合起來,使AI能夠自行發(fā)現(xiàn)更優(yōu)的解決方案。
正因如此,Sakana AI的研究更像是在模擬「人工界的自然進(jìn)化」,充滿了開創(chuàng)性和想象力。
提出DGM的論文兩位共同一作是UBC在讀博士張卓婷和胡圣然。

胡勝然是南方科技大學(xué)計(jì)算機(jī)專業(yè)2021屆畢業(yè)生。

另一位作者是谷歌DeepMind的陸聰,參與了Genie 3的研發(fā)。
他是牛津大學(xué)計(jì)算機(jī)博士,之前在UBC做博士后。

進(jìn)化式AI的崛起
Sakana AI在ICFP 2025上的奪冠預(yù)示著進(jìn)化式AI與自動(dòng)編程的巨大潛能。
第一,這次「人機(jī)協(xié)同」破題的案例證明了生成式AI可以成為人類程序員的放大器:AI并非簡單取代開發(fā)者,而是擔(dān)當(dāng)探索者和助手的角色,幫助人類突破瓶頸。
在生成式AI浪潮席卷編程領(lǐng)域的當(dāng)下,大多數(shù)代碼生成工具還只能充當(dāng)聽話的「代碼翻譯」或「自動(dòng)補(bǔ)全」工具,而Sakana AI展示了一種更新穎的模式——讓AI主動(dòng)出擊、反復(fù)試驗(yàn),去改良和優(yōu)化人類編寫的代碼。
這類似于軟件開發(fā)中的重構(gòu)過程由AI來自動(dòng)執(zhí)行,而且AI還能從中總結(jié)出優(yōu)化規(guī)律反饋給人類,實(shí)現(xiàn)了雙向的知識(shí)流動(dòng)。
第二,Sakana AI的ICFP項(xiàng)目凸顯了進(jìn)化算法在AI時(shí)代的重生。
曾幾何時(shí),進(jìn)化算法和遺傳編程是在AI早期就提出的概念,但隨著機(jī)器學(xué)習(xí)(特別是深度學(xué)習(xí))的崛起,這類基于隨機(jī)試錯(cuò)和自然選擇的方法一度淡出了主流視野。
然而,如今借助強(qiáng)大的算力和預(yù)訓(xùn)練模型,進(jìn)化方法正煥發(fā)新生。它不再是低效的盲目搜索,而成了可以結(jié)合模型智慧的智能探索。
通過大量快速的迭代,AI能夠在復(fù)雜的解空間中找到人類直覺未曾涉足的解決方案。
正如Sakana AI團(tuán)隊(duì)所總結(jié)的,這種人機(jī)分工模式讓AI承擔(dān)了高強(qiáng)度的搜索優(yōu)化工作,人類則專注宏觀策略和結(jié)果判斷,最終效果遠(yuǎn)超單打獨(dú)斗。
第三,這一成果對(duì)自動(dòng)編程領(lǐng)域也是一劑強(qiáng)心針。
自動(dòng)編程一直是AI研究的圣杯之一。
而Sakana AI的實(shí)踐表明,我們離這個(gè)目標(biāo)又近了一步:借由演化式的反復(fù)完善,AI已經(jīng)能在特定任務(wù)上顯著優(yōu)化代碼性能,甚至自主發(fā)現(xiàn)新的算法思路。
這暗示著未來的軟件開發(fā)可能將發(fā)生范式轉(zhuǎn)變,程序不再僅僅由人類一次性編寫完畢,而是由人類與AI共同演化而來。
開發(fā)者或許更像園丁,培育和引導(dǎo)AI代碼的生長;AI則如同茁壯成長的「數(shù)字生物」,在不斷迭代中進(jìn)化出更優(yōu)雅高效的代碼。
當(dāng)我們回望這次ICFP奪冠歷程,可以說Sakana AI用一次精彩的實(shí)戰(zhàn)為業(yè)界上了一課:AI的潛力不止于模仿人類智能,它還能與人類協(xié)作,共同創(chuàng)造出遠(yuǎn)超各自單獨(dú)能力的成果。
從自然進(jìn)化中獲得靈感的「Sakana模式」,為生成式AI和自動(dòng)編程指明了一條新路。
或許在不久的將來,我們將看到更多「AI+人類」協(xié)作的創(chuàng)新場景:從難題攻關(guān)、軟件優(yōu)化,到科研探索、工程設(shè)計(jì)。
當(dāng)AI學(xué)會(huì)了進(jìn)化和自我改進(jìn),整個(gè)人工智能產(chǎn)業(yè)也將隨之邁入一個(gè)充滿生機(jī)與變革的新紀(jì)元。
正如Sakana AI那條逆流而上的紅色小魚所寓意的,真正的變革往往源自那些敢于另辟蹊徑的探索者。
Sakana AI和他們的ICFP項(xiàng)目,正在用實(shí)踐證明,進(jìn)化的力量,足以開創(chuàng)AI的下一段傳奇。

































