“iFold”,蘋果AI新成果
起猛了,蘋果怎么搞起跨界AI模型了??
發(fā)布了一個(gè)基于流匹配的蛋白質(zhì)折疊模型SimpleFold,被網(wǎng)友戲稱為“iFold”。

SimpleFold沒(méi)有花里胡哨的專屬模塊設(shè)計(jì),就靠通用的Transformer模塊,搭配流匹配生成范式,3B參數(shù)版本追平了該領(lǐng)域頂流模型谷歌AlphaFold2的性能。

蘋果這波跨界看來(lái)玩的是化繁為簡(jiǎn)。
MacBook Pro跑起來(lái)不費(fèi)力
首先來(lái)說(shuō)說(shuō)蛋白質(zhì)折疊是怎么一回事。
核心是將“一串”氨基酸折成特定的3D形狀,這樣蛋白質(zhì)才能發(fā)揮作用。
而蛋白質(zhì)折疊模型就是從氨基酸的一級(jí)序列預(yù)測(cè)它的三維空間構(gòu)象。
之前最厲害的模型,比如谷歌的AlphaFold2,雖然實(shí)現(xiàn)了突破,但用了很多復(fù)雜的專屬設(shè)計(jì)。
比如要分析大量相似蛋白質(zhì)的序列,依賴多序列對(duì)比(MSA)構(gòu)建進(jìn)化信息、靠三角注意力優(yōu)化空間約束、推理時(shí)需調(diào)用超算級(jí)算力,普通實(shí)驗(yàn)室不太能用得起。
但這款“iFold”用通用AI框架解決了這個(gè)問(wèn)題。

SimpleFold在架構(gòu)上采用多層Transformer編碼器作為核心骨干,僅通過(guò)自適應(yīng)層歸一化適配蛋白質(zhì)序列特征,相當(dāng)于用“通用工具箱”解決專屬領(lǐng)域難題。
核心創(chuàng)新在于引入流匹配生成技術(shù)。
不同于擴(kuò)散模型的逐步去噪,流匹配通過(guò)學(xué)習(xí)從隨機(jī)噪聲分布到蛋白質(zhì)構(gòu)象分布的光滑映射,實(shí)現(xiàn)一步式生成原子坐標(biāo)。

在訓(xùn)練階段,團(tuán)隊(duì)構(gòu)建了包含900萬(wàn)條數(shù)據(jù)的混合數(shù)據(jù)集,訓(xùn)練出了100M到3B參數(shù)的多尺度模型,其中SimpleFold-3B在CAMEO22 基準(zhǔn)測(cè)試中,性能達(dá)到AlphaFold2的95%。
在CASP14高難度測(cè)試集上,超越同類流匹配模型ESMFold。

還值得一提的是效率,在搭載M2 Max芯片的MacBook Pro上,處理512殘基序列的推理時(shí)間僅需兩三分鐘,遠(yuǎn)超傳統(tǒng)模型的小時(shí)級(jí)耗時(shí)。

研究團(tuán)隊(duì)
這項(xiàng)研究的第一作者Yuyang Wang本科畢業(yè)于同濟(jì)大學(xué),后赴美國(guó)卡內(nèi)基梅隆大學(xué)深造,陸續(xù)取得機(jī)械工程碩士、機(jī)器學(xué)習(xí)碩士以及機(jī)械工程博士學(xué)位,長(zhǎng)期的學(xué)習(xí)為其相關(guān)領(lǐng)域研究筑牢根基。
他有在Momenta從事強(qiáng)化學(xué)習(xí)研發(fā)的實(shí)習(xí)經(jīng)歷,還曾在蘋果公司擔(dān)任AI/ML Resident,專注于擴(kuò)散模型研究,之后成為蘋果的機(jī)器學(xué)習(xí)研究員。

通訊作者是華人機(jī)器學(xué)習(xí)工程師Jiarui Lu,本科畢業(yè)于清華大學(xué),就讀期間還在朱軍教授實(shí)驗(yàn)室中擔(dān)任研究助理。
隨后,Lu在卡內(nèi)基梅隆大學(xué)取得了機(jī)器學(xué)習(xí)碩士學(xué)位,畢業(yè)后于2020年加入蘋果公司。
曾經(jīng)主導(dǎo)了一套關(guān)于大模型工具調(diào)用能力的Benchmark——ToolSandbox這一蘋果開源成果。

關(guān)于這款“iFold”,有感興趣的、想扒技術(shù)細(xì)節(jié)的朋友可戳文末鏈接~
論文地址:https://arxiv.org/abs/2509.18480
代碼地址:https://github.com/apple/ml-simplefold




























