設(shè)計(jì)師大解放!清華發(fā)布「建筑平面圖」自動(dòng)生成模型 | ACL'25
建筑平面圖是AEC(建筑、工程、施工)領(lǐng)域的核心 「語(yǔ)言」,貫穿設(shè)計(jì)思想草繪、方案交流與落地執(zhí)行全流程。而住宅作為人們?nèi)粘I畹幕究臻g載體,其平面圖更是在建筑設(shè)計(jì)早期發(fā)揮著核心作用。
然而,傳統(tǒng)平面圖設(shè)計(jì)流程高度依賴建筑師個(gè)人經(jīng)驗(yàn),存在效率低、反饋慢、缺乏智能輔助等問(wèn)題。
針對(duì)這一挑戰(zhàn),平面圖自動(dòng)生成模型(如GAN、擴(kuò)散模型)不斷涌現(xiàn),但現(xiàn)有研究忽略了一個(gè)關(guān)鍵矛盾:
傳統(tǒng)評(píng)估依賴FID、PSNR、GED等統(tǒng)計(jì)指標(biāo),僅衡量圖像質(zhì)量或結(jié)構(gòu)相似性,完全未融入建筑專業(yè)知識(shí)——即便模型在這些指標(biāo)上表現(xiàn)優(yōu)異,生成的平面圖仍可能存在 「功能分區(qū)混亂、流線低效、空間比例失衡」 等致命問(wèn)題,難以應(yīng)用于實(shí)際設(shè)計(jì)。
此外,已有研究方案還存在三重局限:
1. 數(shù)據(jù)集缺乏建筑師專業(yè)反饋,無(wú)法為模型提供 「何為合理設(shè)計(jì)」 的指導(dǎo);
2. 是評(píng)估標(biāo)準(zhǔn)與建筑實(shí)際需求脫節(jié),無(wú)法篩選出真正可行的方案;
3. 是生成模型未整合人類反饋優(yōu)化,難以對(duì)齊建筑師的設(shè)計(jì)偏好。
針對(duì)上述痛點(diǎn),清華大學(xué)深圳國(guó)際研究生院副教授呂帥團(tuán)隊(duì)提出FloorPlan-LLaMa模型,采用自回歸生成架構(gòu),并創(chuàng)新性地引入「基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)」機(jī)制,使模型在自動(dòng)生成建筑平面圖時(shí),能夠有效實(shí)現(xiàn)住宅功能區(qū)域分布的合理性與空間布局的清晰性,同時(shí)具備良好的房間輪廓表達(dá)與形式美感。

論文地址:https://aclanthology.org/2025.acl-long.331/
模型不僅學(xué)習(xí)建筑師在功能分區(qū)與空間流線組織方面的專業(yè)偏好,還能夠把握整體構(gòu)圖的協(xié)調(diào)性與設(shè)計(jì)邏輯。
該方法實(shí)現(xiàn)設(shè)計(jì)生成與專家判斷之間的深度協(xié)同,提升了生成式平面圖在實(shí)際使用場(chǎng)景中的設(shè)計(jì)質(zhì)量與實(shí)用價(jià)值。

FloorPlan-LLaMa模型的優(yōu)勢(shì)
該論文近日被自然語(yǔ)言處理與人工智能領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議ACL錄用,并獲得領(lǐng)域主席獎(jiǎng)。
ACL大會(huì)是自然語(yǔ)言處理與人工智能領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議。
本屆大會(huì)共收到超過(guò)8000篇投稿,243篇論文被遴選為口頭報(bào)告,47篇論文獲得高級(jí)領(lǐng)域主席推薦獎(jiǎng)(SAC Highlights)。
FP-LLaMa模型的成功入選,充分體現(xiàn)了該研究在跨學(xué)科創(chuàng)新和應(yīng)用實(shí)踐方面的領(lǐng)先性和影響力。
第一作者為清華大學(xué)博士生殷俊,共同第一作者為清華大學(xué)博士生曾鵬宇,通訊作者為該校副教授呂帥,團(tuán)隊(duì)其它成員還包括孫浩源,張淼,戴語(yǔ)琴,鄭涵,張亞超。
技術(shù)核心
FloorPlan-LLaMa 模型圍繞「讓 AI 理解建筑專業(yè)需求」的理念設(shè)計(jì),其包含數(shù)據(jù)集、評(píng)分模型和生成模型三大核心組件:
研究人員提出了ArchiMetricsNet數(shù)據(jù)集,這是第一個(gè)包含三個(gè)專業(yè)評(píng)估維度(功能性、流線和整體評(píng)估)以及詳細(xì)文本分析的平面圖數(shù)據(jù)集。

ArchiMetricsNet數(shù)據(jù)集內(nèi)容示意
研究人員使用ArchiMetricsNet數(shù)據(jù)集,訓(xùn)練了一個(gè)專為平面圖多維度評(píng)估設(shè)計(jì)的模型FloorPlan-MPS(多維度偏好分?jǐn)?shù)),將該模型生成的分?jǐn)?shù)稱為ARS(建筑合理性分?jǐn)?shù))。
研究人員開(kāi)發(fā)了FP-LLaMa生成模型,一個(gè)基于自回歸框架的平面圖生成模型。
為了整合建筑師的專業(yè)知識(shí)和偏好,F(xiàn)loorPlan-MPS在RLHF過(guò)程中被用作獎(jiǎng)勵(lì)模型,使FP-LLaMa的輸出與社區(qū)需求保持一致。
該方法采用了自回歸生成機(jī)制,巧妙地消除了RLHF階段反向擴(kuò)散過(guò)程中對(duì)噪聲預(yù)測(cè)的需要。
具體來(lái)說(shuō),使用FloorPlan Tokenizer將平面圖轉(zhuǎn)換為離散的詞元序列,并使用Next-Token Prediction順序生成平面圖。
此外,為了提高效率,研究人員還結(jié)合了類條件機(jī)制和無(wú)分類器指導(dǎo)。

FP-LLaMa的三大階段框架
FloorPlan Tokenizer:采用與VQGAN類似的編碼器-量化器-解碼器框架,可將連續(xù)的樓層平面圖數(shù)據(jù)轉(zhuǎn)換為離散標(biāo)記,且訓(xùn)練時(shí)會(huì)同時(shí)采用重建損失、基于LPIPS的感知損失及來(lái)自PatchGAN判別器的對(duì)抗損失:

Next-Token Prediction:在推理時(shí),F(xiàn)P-LLaMa使用自回歸框架按順序生成詞元。對(duì)于樓層平面圖詞元序列帶有自回歸預(yù)測(cè)的Next-Token。
當(dāng)For到達(dá)推理層時(shí),計(jì)劃詞元FP-LLaMa序列生成
,下一個(gè)詞元的概率由下式給出:

作為一個(gè)融合了建筑學(xué)專業(yè)知識(shí)的模型,該方法實(shí)現(xiàn)設(shè)計(jì)生成與專家判斷之間的深度協(xié)同,提升了生成式平面圖在實(shí)際使用場(chǎng)景中的設(shè)計(jì)質(zhì)量與實(shí)用價(jià)值。
實(shí)驗(yàn)結(jié)果
研究人員在提出的建筑指標(biāo)網(wǎng)絡(luò)(ArchiMetricsNet)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),采用四個(gè)關(guān)鍵評(píng)估指標(biāo):
FID(弗雷歇初始距離)、SSIM(結(jié)構(gòu)相似性指數(shù)測(cè)量)、PSNR(峰值信噪比)以及新提出的ARS(建筑合理性得分,F(xiàn)loorPlan - MPS模型的評(píng)估結(jié)果)。
研究人員測(cè)試了兩種不同的生成任務(wù):類別條件生成和文本條件生成。
對(duì)比時(shí)選擇了以下基線方法:HouseGAN 、HouseGAN++、HouseDiffusion 、FloorPlanDiffusion 、Tell2Design、Obj-GAN、Qwen2.5-7B-Instruct、ChatGLM4V。
定性實(shí)驗(yàn)
類條件生成
生成中HouseGAN 等現(xiàn)有先進(jìn)模型或基于圖形、或用輸入房間塊生成布局,為公平比較,每種方法均采樣500張圖像并選建筑合理性得分中位數(shù)示例,按FloorPlanDiffusion顏色配置展示。

不同方法在Text-Conditional task上生成的平面圖的定性結(jié)果

ClassConditional任務(wù)上的平均人工評(píng)估分?jǐn)?shù)

ClassConditional任務(wù)上的人工評(píng)估勝率
文本條件生成
受Tell2Design啟發(fā),研究人員將大語(yǔ)言模型用于 「隔壁房間序列預(yù)測(cè)」任務(wù),以 Llama-3.2-11B-Vision-Instruct 為主干,對(duì)比 ChatGLM4V 等模型;
現(xiàn)有方法雖能生成高質(zhì)量圖像,但建筑師視角下次優(yōu),而帶RLHF的FP-LLaMa布局更實(shí)用。
定量實(shí)驗(yàn)
為公平比較,研究人員計(jì)算不同方法生成平面圖的度量時(shí)采用FloorPlanDiffusion配色方案,下表展現(xiàn)傳統(tǒng)指標(biāo)性能。

不同方法間類條件生成結(jié)果

不同方法在文本條件生成中的結(jié)果

下表則使用建筑合理性得分(ARS)評(píng)估;

不同方法在類條件生成中的建筑合理些得分(ARS)

不同方法在文本條件生成中的建筑合理些得分(ARS)
結(jié)果表現(xiàn)為FP-LLaMa傳統(tǒng)指標(biāo)最佳,加RLHF后傳統(tǒng)指標(biāo)略降,但ARS比次優(yōu)方法高8.54%且貼合建筑師偏好,未加RLHF的FP-LLaMa評(píng)分近傳統(tǒng)方法,這說(shuō)明清晰度和與真實(shí)值相似性不代表設(shè)計(jì)合理,因原始數(shù)據(jù)集含不合理布局且有偏差。
總結(jié)
研究人員試圖通過(guò)引入ArchiMetricsNet(一個(gè)具有人類反饋的數(shù)據(jù)集)來(lái)解決現(xiàn)有建筑平面圖生成和評(píng)估方法的局限性;
FP-LLaMa,一個(gè)微調(diào)的自回歸模型,與專業(yè)建筑師保持一致。
這項(xiàng)工作推進(jìn)了人類專業(yè)知識(shí)在建筑平面圖生成技術(shù)中的整合,并展示了大型自回歸生成模型在「建筑、工程與施工」領(lǐng)域的潛力。















 
 
 












 
 
 
 