北大CogSci 2025(Oral)| 人類創(chuàng)造力的核心機制,AI已經(jīng)開始掌握了
“AI永遠無法取代人類”證據(jù)-1!
北大團隊最新論文揭示:人類引以為傲的創(chuàng)造力,如今AI也開始掌握了。
甚至,研究人員還提出了一種系統(tǒng)性框架,首次從認知科學(xué)的角度,對AI模型的組合創(chuàng)造力(Combinational Creativity)進行了量化評估與優(yōu)化。
結(jié)果發(fā)現(xiàn),GPT-4等先進模型在創(chuàng)意理解任務(wù)上已經(jīng)超越普通人類(準確率70% vs. 50%)。
這項研究不僅揭示了當前先進模型理解組合創(chuàng)造力的水平,還提出了一種可計算的方法,顯著提升了AI的創(chuàng)意生成能力。
值得一提的是,這篇論文還被認知科學(xué)學(xué)會年度會議CogSci 2025收錄,并被大會選為口頭報告(Oral)進行現(xiàn)場講解。
所以,這到底是咋回事兒呢?
AI開始掌握人類創(chuàng)造力的核心機制
一切起源于這樣一個問題:
當AI看到寄居蟹住進易拉罐,它想到了什么?
一只寄居蟹鉆進廢棄的易拉罐——這個畫面你可能在海灘上見過。大多數(shù)人只是一笑而過,但藝術(shù)家卻能從中讀出深刻的環(huán)保警示,比如人類垃圾正在成為野生動物的“新家園”。
那么,人工智能會怎么“想”呢?
最新研究揭示了一個令人驚訝的答案:AI正在學(xué)會像藝術(shù)家一樣進行“組合創(chuàng)造”。不是簡單地拼貼概念,而是真正理解為什么某些看似不相關(guān)的元素組合在一起會產(chǎn)生全新的意義。
當AI看到寄居蟹與易拉罐的組合時,它不僅能識別出“動物+容器”的基本元素,還能解釋它們之間的功能關(guān)聯(lián)(都是“居住空間”),更進一步,它開始理解這種組合背后的深層含義,即對人類活動影響自然生態(tài)的反思。
這種從“識別”→“解釋”→“引申”的三層認知過程,正是人類創(chuàng)造力的核心機制。而現(xiàn)在,AI也開始掌握這種能力了。
要知道在人類智能的諸多特質(zhì)中,創(chuàng)造力被認為是最難被機器復(fù)制的能力之一。
尤其是“組合創(chuàng)造力”(Combinational Creativity),即通過重新組合已有概念,生成新穎、富有意義的想法,被視為真正創(chuàng)新的核心。
盡管近年來如GPT-4V、DALL·E 3等視覺-語言模型(VLMs)在生成圖像和文本方面展現(xiàn)出驚人的“創(chuàng)意”,但其底層機制究竟是真正的“創(chuàng)造性組合”,還是對訓(xùn)練數(shù)據(jù)的復(fù)雜模仿,仍是AI研究領(lǐng)域爭論的焦點。
傳統(tǒng)評估AI創(chuàng)造力的方法多聚焦于結(jié)果的“新穎性”與“實用性”,而忽略了“創(chuàng)造性過程”本身的結(jié)構(gòu)與機制。
因此,要判斷AI是否真的“理解”組合創(chuàng)造,就必須建立一個能夠揭示其認知路徑的系統(tǒng)框架。
用系統(tǒng)性框架量化評估AI的“組合創(chuàng)造力”
對此,受認知科學(xué)家Margaret Boden和認知科學(xué)中的“概念融合理論”(Conceptual Blending Theory)的啟發(fā),研究團隊首次提出了一個面向AI系統(tǒng)的分層評估框架——IEI框架(Identification–Explanation–Implication)。
該框架將組合創(chuàng)造力分解為三個層次:
- 識別(Identification):能否正確分解輸入概念的基本元素;
- 解釋(Explanation):能否發(fā)現(xiàn)概念間的潛在關(guān)聯(lián);
- 引申(Implication):能否理解超越原始輸入的語義內(nèi)涵。
這一框架不僅適用于評估AI,也為人類創(chuàng)造力的計算化研究提供了新思路。
上圖展示了IEI框架如何結(jié)合“概念融合理論”,對組合創(chuàng)造力進行建模與評估。
在左側(cè),兩個輸入概念通過共性抽象(Generic Space)與融合空間(Blend Space)產(chǎn)生新的組合創(chuàng)意。
右側(cè)則對應(yīng)IEI框架在理解與生成任務(wù)中的三層處理邏輯:從識別基本元素(如寄居蟹與易拉罐)、解釋功能類比(如容器功能相似),再到引申出更深層的意義(如對人類破壞動物棲息地的環(huán)保反思)。
這一流程可用于系統(tǒng)評估AI模型對組合創(chuàng)意的理解能力,并引導(dǎo)生成具有多層含義的創(chuàng)意內(nèi)容。
實驗結(jié)果:超越平均人類,但仍不及專家
通過構(gòu)建包含專業(yè)藝術(shù)家創(chuàng)作組合的數(shù)據(jù)集(CreativeMashup),研究發(fā)現(xiàn):
GPT-4等先進模型在創(chuàng)意理解任務(wù)上已超越普通人類(準確率70% vs. 50%);但在深層語義解讀(如隱喻、文化象征)上,仍顯著落后于人類專家(人類專家的平均勝率為78%)。
下圖為人類被試與模型在三個任務(wù)上的實驗結(jié)果:
更關(guān)鍵的是,當研究團隊將這一框架嵌入生成模型(如DALL-E 3)時,其創(chuàng)意輸出的質(zhì)量提升了35%(基于人類專家盲測)。
這表明,AI的創(chuàng)造力并非固定不變,而是可以通過結(jié)構(gòu)化思維引導(dǎo)優(yōu)化。
下圖展示了多個主流文圖生成模型在創(chuàng)意生成任務(wù)中的表現(xiàn),分別由人類專家、完整的IEI 方法(識別+解釋+引申),以及簡化的II方法(識別+引申)進行偏好排名評估。
排名分數(shù)越低表示生成結(jié)果越受歡迎。
可以看出,使用IEI框架優(yōu)化后的模型在生成質(zhì)量上更接近人類專家偏好,說明該方法在提升創(chuàng)意輸出方面具有顯著效果。
從理論到應(yīng)用:AI創(chuàng)造力的未來
總體而言,該研究的價值不僅在于評估,更在于為AI的創(chuàng)造性應(yīng)用提供了方法論:
- 設(shè)計:使AI能真正理解“為什么這樣組合有意義”,而非機械拼貼;
- 認知研究:為人類與機器創(chuàng)造力的比較提供了標準化基準。
這組圖像展示了AI如何通過重組動物特征來表達抽象屬性,如顏色、速度、用途與形態(tài),以視覺方式呈現(xiàn)出對不同概念特征的理解與創(chuàng)意表達。
也可以把看起來無關(guān)的物體和概念組合在一起,生成帶有隱喻的圖像,用一種新穎的方式表達社會話題。
同時,還能將日常用品(如護手霜、背包)與象征物(如花朵、皇冠、地圖)進行創(chuàng)意組合,以展現(xiàn)AI在產(chǎn)品設(shè)計中的應(yīng)用潛力。
順便一提,目前團隊創(chuàng)建的CreativeMashup數(shù)據(jù)集已開放下載。
論文地址:https://ppyyqq.github.io/aicc/