偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

讓模型預(yù)見(jiàn)數(shù)據(jù)分布變化，東京大學(xué)等提出時(shí)態(tài)域泛化全新框架

作者：量子位 2024-11-21 13:40:00

人工智能新聞

東京大學(xué)等高校的研究人員提出了名為Koodos的新框架，可以基于在一些隨機(jī)時(shí)間點(diǎn)觀測(cè)的數(shù)據(jù)分布，在任意時(shí)刻生成當(dāng)下適用的神經(jīng)網(wǎng)絡(luò)。

在數(shù)據(jù)分布持續(xù)變化的動(dòng)態(tài)環(huán)境中，如何進(jìn)行連續(xù)模型泛化？

東京大學(xué)等高校的研究人員提出了名為Koodos的新框架，可以基于在一些隨機(jī)時(shí)間點(diǎn)觀測(cè)的數(shù)據(jù)分布，在任意時(shí)刻生成當(dāng)下適用的神經(jīng)網(wǎng)絡(luò)。

盡管數(shù)據(jù)隨時(shí)間持續(xù)發(fā)生變化，但是泛化的模型能在連續(xù)時(shí)間中與數(shù)據(jù)分布始終保持協(xié)調(diào)一致。

Koodos將模型的復(fù)雜非線性動(dòng)態(tài)轉(zhuǎn)化為可學(xué)習(xí)的連續(xù)動(dòng)態(tài)系統(tǒng)，同時(shí)利用先驗(yàn)知識(shí)以確保泛化過(guò)程的穩(wěn)定性和可控性。

實(shí)驗(yàn)表明，Koodos顯著超越現(xiàn)有方法，為時(shí)域泛化開(kāi)辟了全新的研究方向。

模型泛化面臨三大難題

在實(shí)際應(yīng)用中，數(shù)據(jù)集的數(shù)據(jù)分布往往隨著時(shí)間而不斷變化，預(yù)測(cè)模型需要持續(xù)更新以保持準(zhǔn)確性。

時(shí)域泛化旨在預(yù)測(cè)未來(lái)數(shù)據(jù)分布，從而提前更新模型，使模型與數(shù)據(jù)同步變化。

領(lǐng)域泛化（Domain Generalization, DG）作為一種重要的機(jī)器學(xué)習(xí)策略，旨在學(xué)習(xí)一個(gè)能夠在未見(jiàn)目標(biāo)領(lǐng)域中也保持良好表現(xiàn)的模型。

近年來(lái)研究人員發(fā)現(xiàn)，在動(dòng)態(tài)環(huán)境中，領(lǐng)域數(shù)據(jù)（Domain Data）分布往往具有顯著的時(shí)間依賴性，這促使了時(shí)域泛化（Temporal Domain Generalization, TDG）技術(shù)的快速發(fā)展。

時(shí)域泛化將多個(gè)領(lǐng)域視為一個(gè)時(shí)間序列而非一組獨(dú)立的靜態(tài)個(gè)體，利用歷史領(lǐng)域預(yù)測(cè)未來(lái)領(lǐng)域，從而實(shí)現(xiàn)對(duì)模型參數(shù)的提前調(diào)整，顯著提升了傳統(tǒng)DG方法的效果。

然而，現(xiàn)有的時(shí)域泛化研究集中在“離散時(shí)間域”假設(shè)下，即假設(shè)領(lǐng)域數(shù)據(jù)在固定時(shí)間間隔（如逐周或逐年）收集。

基于這一假設(shè)，概率模型被用于預(yù)測(cè)時(shí)域演變，例如通過(guò)隱變量模型生成未來(lái)數(shù)據(jù)，或利用序列模型（如LSTM）預(yù)測(cè)未來(lái)的模型參數(shù)。

然而在現(xiàn)實(shí)中，領(lǐng)域數(shù)據(jù)的觀測(cè)并不總是在離散、規(guī)律的時(shí)間點(diǎn)上，而是隨機(jī)且稀疏地分布在連續(xù)時(shí)間軸上。

例如在下圖展示的示例中，與傳統(tǒng)TDG假設(shè)的領(lǐng)域在時(shí)間軸上規(guī)律分布不同，實(shí)際情況下人們只能在特定事件發(fā)生時(shí)獲得一個(gè)域，而這些事件的發(fā)生時(shí)間并不固定。

同時(shí)，概念漂移（Concept Drift）在時(shí)間軸上發(fā)生，即領(lǐng)域數(shù)據(jù)分布隨著時(shí)間不斷演變：如活躍用戶增加、新交互行為形成、年齡與性別分布變化等。

理想情況下，每個(gè)時(shí)態(tài)域?qū)?yīng)的預(yù)測(cè)模型也應(yīng)隨時(shí)間逐漸調(diào)整，以應(yīng)對(duì)這種概念漂移。

最后，由于未來(lái)的域采集時(shí)間未知，作者希望泛化預(yù)測(cè)模型到未來(lái)的任意時(shí)刻。

此外，傳統(tǒng)方法也難以保證泛化過(guò)程在整個(gè)時(shí)間流中保持穩(wěn)定和可控。

為了應(yīng)對(duì)這些場(chǎng)景中的模型泛化，作者提出了“連續(xù)時(shí)域泛化”（Continuous Temporal Domain Generalization, CTDG）任務(wù)，其中觀測(cè)和未觀測(cè)的領(lǐng)域均分布于連續(xù)時(shí)間軸上隨機(jī)的時(shí)間點(diǎn)。

CTDG關(guān)注于如何表征時(shí)態(tài)領(lǐng)域的連續(xù)動(dòng)態(tài)，使得模型能夠在任意時(shí)間點(diǎn)實(shí)現(xiàn)穩(wěn)定、適應(yīng)性的調(diào)整，從而完成泛化預(yù)測(cè)。

CTDG任務(wù)的挑戰(zhàn)遠(yuǎn)超傳統(tǒng)的TDG方法。

CTDG不僅需要處理不規(guī)律時(shí)間分布的訓(xùn)練域，更重要的是，它旨在讓模型泛化到任意時(shí)刻，即要求在連續(xù)時(shí)間的每個(gè)點(diǎn)上都能精確描述模型狀態(tài)。

而TDG方法則僅關(guān)注未來(lái)的單步泛化：在觀測(cè)點(diǎn)優(yōu)化出當(dāng)前模型狀態(tài)后，只需將其外推一步即可。

這使得CTDG區(qū)別于TDG任務(wù)——

CTDG的關(guān)鍵在于如何在連續(xù)時(shí)間軸上同步數(shù)據(jù)分布和模型參數(shù)的動(dòng)態(tài)演變，而不是僅局限于未來(lái)某一特定時(shí)刻的模型表現(xiàn)。

具體而言，與TDG任務(wù)相比，CTDG的復(fù)雜性主要來(lái)自以下幾個(gè)尚未被充分探索的核心挑戰(zhàn)：

如何建模數(shù)據(jù)動(dòng)態(tài)并同步模型動(dòng)態(tài)
如何在高度非線性模型動(dòng)態(tài)中捕捉主動(dòng)態(tài)
如何確保長(zhǎng)期泛化的穩(wěn)定性和可控性

接下來(lái)具體分析一下這三大挑戰(zhàn)。

如何建模數(shù)據(jù)動(dòng)態(tài)并同步模型動(dòng)態(tài)

CTDG要求在連續(xù)時(shí)間軸上捕捉領(lǐng)域數(shù)據(jù)的動(dòng)態(tài)，并據(jù)此同步調(diào)整模型狀態(tài)。

然而，數(shù)據(jù)動(dòng)態(tài)本身難以直接觀測(cè)，需要通過(guò)觀測(cè)時(shí)間點(diǎn)來(lái)學(xué)習(xí)。

此外，模型動(dòng)態(tài)的演變過(guò)程也同樣復(fù)雜。理解數(shù)據(jù)演變?nèi)绾悟?qū)動(dòng)模型演變構(gòu)成了CTDG的首要挑戰(zhàn)。

如何在高度非線性模型動(dòng)態(tài)中捕捉主動(dòng)態(tài)

領(lǐng)域數(shù)據(jù)的預(yù)測(cè)模型通常依賴過(guò)參數(shù)化（over-parametrized）的深度神經(jīng)網(wǎng)絡(luò)，模型動(dòng)態(tài)因此呈現(xiàn)出高維、非線性的復(fù)雜特征。

這導(dǎo)致模型的主動(dòng)態(tài)嵌藏在大量潛在維度中。

如何有效提取并將這些主動(dòng)態(tài)映射到可學(xué)習(xí)的空間，是CTDG任務(wù)中的另一重大挑戰(zhàn)。

如何確保長(zhǎng)期泛化的穩(wěn)定性和可控性

為實(shí)現(xiàn)未來(lái)任意時(shí)刻的泛化，CTDG必須確保模型的長(zhǎng)期穩(wěn)定性。

此外，在許多情況下，人們可能擁有數(shù)據(jù)動(dòng)態(tài)的高層次先驗(yàn)知識(shí)。

如何將這些先驗(yàn)知識(shí)嵌入CTDG的優(yōu)化過(guò)程中，進(jìn)而提升泛化的穩(wěn)定性和可控性，是一個(gè)重要的開(kāi)放性問(wèn)題。

模型與動(dòng)態(tài)聯(lián)合優(yōu)化

數(shù)學(xué)問(wèn)題建模

設(shè)計(jì)思路

作者提出的方法通過(guò)模型與數(shù)據(jù)的同步、動(dòng)態(tài)簡(jiǎn)化表示，以及高效的聯(lián)合優(yōu)化展開(kāi)。

具體思路如下：

同步數(shù)據(jù)和模型的動(dòng)態(tài)：作者證明了連續(xù)時(shí)域中模型參數(shù)的連續(xù)性，而后借助神經(jīng)微分方程（Neural ODE）建立模型動(dòng)態(tài)系統(tǒng)，從而實(shí)現(xiàn)模型動(dòng)態(tài)與數(shù)據(jù)動(dòng)態(tài)的同步。
表征高維動(dòng)態(tài)到低維空間：作者將高維模型參數(shù)映射到一個(gè)結(jié)構(gòu)化的庫(kù)普曼空間（Koopman Space）中。該空間通過(guò)可學(xué)習(xí)的低維線性動(dòng)態(tài)來(lái)捕捉模型的主要?jiǎng)討B(tài)。
聯(lián)合優(yōu)化模型與其動(dòng)態(tài)：作者將單個(gè)領(lǐng)域的模型學(xué)習(xí)與各時(shí)間點(diǎn)上的連續(xù)動(dòng)態(tài)進(jìn)行聯(lián)合優(yōu)化，并設(shè)計(jì)了歸納偏置的約束接口，通過(guò)端到端優(yōu)化保證泛化的穩(wěn)定性和可控性。

數(shù)據(jù)動(dòng)態(tài)建模與模型動(dòng)態(tài)同步

也就是說(shuō)，模型參數(shù)會(huì)隨數(shù)據(jù)分布的變化而平滑調(diào)整。

用庫(kù)普曼算子簡(jiǎn)化模型動(dòng)態(tài)

在實(shí)際任務(wù)中，預(yù)測(cè)模型通常依賴于過(guò)參數(shù)化的深度神經(jīng)網(wǎng)絡(luò)，使得模型動(dòng)態(tài)h呈現(xiàn)為在高維空間中糾纏的非線性動(dòng)態(tài)。

直接對(duì)h建模不僅計(jì)算量大，且極易導(dǎo)致泛化不穩(wěn)定。

然而，h受數(shù)據(jù)動(dòng)態(tài)f的支配，而數(shù)據(jù)動(dòng)態(tài)通常是簡(jiǎn)單、可預(yù)測(cè)的。

這意味著在過(guò)參數(shù)化空間中，模型的主動(dòng)態(tài)（Principal Dynamics）可以在適當(dāng)轉(zhuǎn)換的空間內(nèi)進(jìn)行更易于管理的表示。

受此驅(qū)動(dòng)，作者引入了庫(kù)普曼理論（Koopman Theory）來(lái)簡(jiǎn)化復(fù)雜的模型動(dòng)態(tài)。

庫(kù)普曼理論在保持動(dòng)態(tài)系統(tǒng)特征的同時(shí)將復(fù)雜的非線性動(dòng)態(tài)線性化。

最終，通過(guò)庫(kù)普曼算子的引入，作者實(shí)現(xiàn)了對(duì)模型動(dòng)態(tài)的簡(jiǎn)化，保證了泛化過(guò)程的穩(wěn)健性。

聯(lián)合優(yōu)化與先驗(yàn)知識(shí)結(jié)合

作者對(duì)多個(gè)組件同時(shí)施加約束確保模型能穩(wěn)定泛化，其中包含以下關(guān)鍵項(xiàng)：

預(yù)測(cè)準(zhǔn)確性：通過(guò)最小化預(yù)測(cè)誤差，使預(yù)測(cè)模型在每個(gè)觀測(cè)時(shí)間點(diǎn)都能準(zhǔn)確預(yù)測(cè)實(shí)際數(shù)據(jù)。
泛化準(zhǔn)確性：通過(guò)最小化預(yù)測(cè)誤差，使泛化模型在每個(gè)觀測(cè)時(shí)間點(diǎn)都能準(zhǔn)確預(yù)測(cè)實(shí)際數(shù)據(jù)。
重構(gòu)一致性：確保模型參數(shù)在原始空間與庫(kù)普曼空間之間的轉(zhuǎn)換具有一致性。
動(dòng)態(tài)保真性：約束庫(kù)普曼空間的動(dòng)態(tài)行為，使得映射后的空間符合預(yù)期的動(dòng)態(tài)系統(tǒng)特征。
參數(shù)一致性：確保泛化模型參數(shù)映射回原始空間后與預(yù)測(cè)模型參數(shù)保持一致。
引入庫(kù)普曼理論的另一優(yōu)勢(shì)在于，可以通過(guò)庫(kù)普曼算子的譜特性來(lái)評(píng)估模型的長(zhǎng)期穩(wěn)定性。

此外，還可以在庫(kù)普曼算子中施加約束來(lái)控制模型的動(dòng)態(tài)行為。

通過(guò)觀察庫(kù)普曼算子的特征值，可以判斷系統(tǒng)是否穩(wěn)定：

若所有特征值實(shí)部為負(fù)，系統(tǒng)會(huì)穩(wěn)定地趨向于一個(gè)平衡狀態(tài)。
若存在特征值實(shí)部為正，系統(tǒng)將變得不穩(wěn)定，模型在未來(lái)可能會(huì)崩塌。
若特征值實(shí)部為零，系統(tǒng)可能表現(xiàn)出周期性行為。

通過(guò)分析這些特征值的分布，可以預(yù)測(cè)系統(tǒng)的長(zhǎng)期行為，識(shí)別模型在未來(lái)是否可能出現(xiàn)崩潰的風(fēng)險(xiǎn)。

此外，還可以通過(guò)對(duì)庫(kù)普曼算子施加顯式約束來(lái)調(diào)控模型的動(dòng)態(tài)行為。例如：

周期性約束：當(dāng)數(shù)據(jù)動(dòng)態(tài)為周期性時(shí)，可將庫(kù)普曼算子K設(shè)為反對(duì)稱矩陣，使其特征值為純虛數(shù)，從而使模型表現(xiàn)出周期性行為。
低秩近似：將K表示為低秩矩陣，有助于控制模型的自由度，避免過(guò)擬合到次要信息。

通過(guò)這些手段，不僅提高了泛化的長(zhǎng)期穩(wěn)定性，還增強(qiáng)了模型在特定任務(wù)中的可控性。

實(shí)驗(yàn)

實(shí)驗(yàn)設(shè)置

為驗(yàn)證算法效果，作者使用了合成數(shù)據(jù)集和多種真實(shí)世界場(chǎng)景的數(shù)據(jù)集：

合成數(shù)據(jù)集包括 Rotated 2-Moons 和 Rotated MNIST 數(shù)據(jù)集，通過(guò)在連續(xù)時(shí)間區(qū)間內(nèi)隨機(jī)生成時(shí)間戳，并對(duì) Moons 和 MNIST 數(shù)據(jù)按時(shí)間戳逐步旋轉(zhuǎn)生成連續(xù)時(shí)域。

真實(shí)世界數(shù)據(jù)集則包括以下三類：

事件驅(qū)動(dòng)數(shù)據(jù)集Cyclone：基于熱帶氣旋的衛(wèi)星圖像預(yù)測(cè)風(fēng)力強(qiáng)度，氣旋發(fā)生日期對(duì)應(yīng)連續(xù)時(shí)域。
流數(shù)據(jù)集Twitter和House：分別從任意時(shí)間段抽取推文和房?jī)r(jià)數(shù)據(jù)流構(gòu)成一個(gè)領(lǐng)域，多次隨機(jī)抽取形成連續(xù)時(shí)域
不規(guī)則離散數(shù)據(jù)集Yearbook：人像圖片預(yù)測(cè)性別，從 84 年中隨機(jī)抽取 40 年數(shù)據(jù)作為連續(xù)時(shí)域。

定量分析

作者首先對(duì)比了Koodos方法與各基線方法的定量性能。

下表顯示，Koodos方法在所有數(shù)據(jù)集上展現(xiàn)了顯著的性能提升。

在合成數(shù)據(jù)集上，Koodos能夠輕松應(yīng)對(duì)持續(xù)的概念漂移，而所有基線方法在這種場(chǎng)景下全部失效。

在真實(shí)世界數(shù)據(jù)集上，盡管某些基線方法（如 CIDA、DRAIN和DeepODE）在少數(shù)場(chǎng)景中略有表現(xiàn)，但其相較于簡(jiǎn)單方法（如Offline）的改進(jìn)非常有限。

相比之下，Koodos顯著優(yōu)于所有現(xiàn)有方法，彰顯出在時(shí)域泛化任務(wù)中考慮分布連續(xù)變化的關(guān)鍵作用。

決策邊界

為直觀展示泛化效果，作者在Rotated 2-Moons數(shù)據(jù)集上進(jìn)行了決策邊界的可視化。

該任務(wù)具有極高難度：模型需在0到35秒左右的35個(gè)連續(xù)時(shí)域上訓(xùn)練，隨后泛化到不規(guī)律分布在35到50秒的15個(gè)測(cè)試域。而現(xiàn)有方法通常只能泛化至未來(lái)的一個(gè)時(shí)域（T+1），且難以處理不規(guī)律的時(shí)間分布。

下圖展示了從15個(gè)測(cè)試域中選取了7個(gè)進(jìn)行可視化測(cè)試的結(jié)果（紫色和黃色表示數(shù)據(jù)區(qū)域，紅線表示決策邊界）。

結(jié)果清晰地表明，基線方法在應(yīng)對(duì)連續(xù)時(shí)域的動(dòng)態(tài)變化時(shí)表現(xiàn)不足。隨著時(shí)間推進(jìn)，決策邊界逐漸偏離理想狀態(tài)。

尤其是最新的DRAIN方法（ICLR23）在多步泛化任務(wù)中明顯失效。

相比之下，Koodos在所有測(cè)試域上展現(xiàn)出卓越的泛化能力，始終保持清晰、準(zhǔn)確的決策邊界，與實(shí)際數(shù)據(jù)分布變化高度同步。

這一效果突顯了Koodos在時(shí)域泛化任務(wù)中的優(yōu)勢(shì)。

模型演變軌跡

為更深入地分析模型的泛化能力，作者通過(guò)t-SNE降維，將不同方法的模型參數(shù)的演變過(guò)程（Model Evolution Trajectory）在隱空間中可視化。

可以看出，Koodos的軌跡呈現(xiàn)出平滑而有規(guī)律的螺旋式上升路徑，從訓(xùn)練域平滑延伸至測(cè)試域。

這一軌跡表明，Koodos能夠在隱空間中有效捕捉數(shù)據(jù)分布的連續(xù)變化，并隨時(shí)間自然地?cái)U(kuò)展泛化。

相比之下，基線模型的軌跡在隱空間中缺乏清晰結(jié)構(gòu)，隨著時(shí)間推移，逐漸出現(xiàn)明顯的偏離，未能形成一致的動(dòng)態(tài)模式。

時(shí)域泛化的分析與控制

在 Koodos 模型中，庫(kù)普曼算子為分析模型動(dòng)態(tài)提供了有效手段。

作者對(duì)Koodos在2-Moons數(shù)據(jù)集上分析表明，庫(kù)普曼算子的特征值在復(fù)平面上分布在穩(wěn)定區(qū)和不穩(wěn)定區(qū)。

這意味著Koodos在中短期內(nèi)能穩(wěn)定泛化，但在極長(zhǎng)時(shí)間的預(yù)測(cè)上將會(huì)逐漸失去穩(wěn)定性，偏離預(yù)期路徑（下圖b）。

為提升模型的穩(wěn)定性，作者通過(guò)將庫(kù)普曼算子配置為反對(duì)稱矩陣（即Koodos版本），確保所有特征值為純虛數(shù)，使模型具有周期性穩(wěn)定特性。

在這一配置下，Koodos展現(xiàn)出高度一致的軌跡，即使在長(zhǎng)時(shí)間外推過(guò)程中依然保持穩(wěn)定和準(zhǔn)確，證明了引入先驗(yàn)知識(shí)對(duì)增強(qiáng)模型穩(wěn)健性的效果（下圖c）。

（a：部分訓(xùn)練域數(shù)據(jù)；b：不受控，模型最終偏離預(yù)期；c：受控，模型始終穩(wěn)定且準(zhǔn)確。）

時(shí)域泛化與生成式模型任務(wù)有天然的關(guān)聯(lián)，Koodos所具備的泛化能力能夠?yàn)樯窠?jīng)網(wǎng)絡(luò)生成技術(shù)帶來(lái)新的可能。

Koodos的應(yīng)用并不局限于時(shí)域泛化，它也可以適用于其他分布變化的任務(wù)中。

作者計(jì)劃探索其在非時(shí)態(tài)領(lǐng)域的應(yīng)用。

同時(shí)，作者也將探索時(shí)域泛化在大模型中的集成，幫助LLM在復(fù)雜多變的分布中保持魯棒性和穩(wěn)定性。

論文地址：https://arxiv.org/pdf/2405.16075
GitHub：https://github.com/Zekun-Cai/Koodos/

責(zé)任編輯：張燕妮來(lái)源：量子位

AI 數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)