偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<cite id="xqrtf"></cite>

<style id="xqrtf"><rp id="xqrtf"><tbody id="xqrtf"></tbody></rp></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

時序預(yù)測Decoder中的時間步依賴問題

發(fā)布于 2024-7-5 08:51

瀏覽

0收藏

今天跟大家聊聊一個近期相對冷門的研究點：Decoder中的預(yù)測時間步依賴問題。

目前主流的時間序列預(yù)測模型，Decoder一般采用一個簡單的MLP網(wǎng)絡(luò)，輸入Encoder的表征，映射到預(yù)測結(jié)果。但是，這種建模方法并沒有考慮到各個預(yù)測時間步之間的關(guān)系，可能導(dǎo)致在預(yù)測階段不滿足時間序列的平滑性。

在更早的深度學(xué)習(xí)時間序列預(yù)測工作中，一般會將上一個時刻的預(yù)測結(jié)果或者真實結(jié)作為下一個時刻的輸入，自回歸的逐步進行預(yù)測。這種建模方法，可以建立起各個預(yù)測時間步之間的關(guān)系，但同時也會引入諸如誤差累積、訓(xùn)練和預(yù)測階段不一致等問題。

今天這篇文章，就帶大家了解一些Decoder這種考慮預(yù)測結(jié)果依賴的建模方法，并介紹2篇近期的工作，針對預(yù)測時間步依賴問題進行優(yōu)化。

1.Decoder中的預(yù)測時間步依賴

在Decoder中考慮預(yù)測時間步依賴的建模方法中，可以分成2種類型，分別是Free Running和Teacher Forcing。

Free Running：Free Running在訓(xùn)練階段輸入真實值，在預(yù)測階段由于無法獲取到真實值，就輸入上一個時刻的預(yù)測值代替。這種方法的問題在于，訓(xùn)練和預(yù)測存在不一致問題。為了解決這個問題，一些方法在訓(xùn)練階段以一定比例輸入預(yù)測值，一定比例輸入真實值，縮小訓(xùn)練和預(yù)測的gap。或者使用一個權(quán)重，對預(yù)測值和真實值加權(quán)，或者加入噪聲。

Teacher Forcing：另一種是在訓(xùn)練階段輸入上一個時刻側(cè)預(yù)測值。這種方法在訓(xùn)練階段和預(yù)測階段是一致的，但是問題在于會存在誤差累積問題。預(yù)測結(jié)果隨著時間步的增長越來越不準(zhǔn)確，引入預(yù)測結(jié)果會逐步累積誤差，使模型效果變差。

針對建模Decoder時間步關(guān)系依賴的問題，業(yè)內(nèi)也有很多研究工作。下面給大家介紹2篇近期發(fā)表的相關(guān)文章。第一篇文章引入輔助模型，緩解Teacher Forcing中的誤差累積問題；第二篇文章直接優(yōu)化目前主流的MLP Decoder模型，引入輔助loss讓其考慮到各個時間步的依賴。

2.引入輔助模型緩解誤差累積

為了緩解Teacher Forcing方法的誤差累積問題，Reinforced Decoder: Towards Training Recurrent Neural Networks for Time Series Forecasting（2024）提出引入一個輔助模型庫，用輔助模型庫的預(yù)測結(jié)果，代替原來Teacher Forcing中正在訓(xùn)練模型的預(yù)測結(jié)果。通過這種方式，每個時間步的預(yù)測結(jié)果由外部模型產(chǎn)生，避免一直引入目標(biāo)模型，隨著時間步的增長，誤差逐漸累積的問題。

具體實現(xiàn)方法上，文中引入一個model pool，這個model pool內(nèi)都是一些訓(xùn)練好的時間序列預(yù)測模型，使用這個model pool中模型的預(yù)測結(jié)果作為輸入，而非正在訓(xùn)練的模型本身，這樣就可以正在訓(xùn)練模型引入上一個時刻預(yù)測結(jié)果帶來的誤差累積問題。同時為了進一步提升效果，文中采用了一個強化學(xué)習(xí)的方法，每個時刻從model pool中選擇最合適的預(yù)測結(jié)果作為輸入，以預(yù)測效果為reward進行強化學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練，以此實現(xiàn)讓目標(biāo)模型效果最優(yōu)的預(yù)測結(jié)果的選擇。

3.直接解碼中引入差分輔助loss

相比于依賴上一個時刻的預(yù)估結(jié)果的遞歸解碼方法，直接解碼方法，即直接使用一個MLP將Encoder表征映射到預(yù)測結(jié)果，目前應(yīng)用更加廣泛，并且十分簡潔高效。那么，能否在這種建模方法中，讓模型建立起Decoder各個時間步之間的依賴呢？

TDT Loss Takes It All: Integrating Temporal Dependencies among Targets into Non-Autoregressive Time Series Forecasting（2024）中就提出了這樣一種建模方法。整體實現(xiàn)非常簡單，在原始的base模型基礎(chǔ)上引入了一個損失函數(shù)度量預(yù)測結(jié)果之間的關(guān)系。文中引入的這個度量是差分結(jié)果，比如一階差分結(jié)果，就是t時刻的預(yù)測結(jié)果減去t-1時刻的預(yù)測結(jié)果。這個度量的是相鄰兩個預(yù)測窗口值之間的大小關(guān)系。文中通過計算這個預(yù)測值的差分結(jié)果，和真實值的差分結(jié)果之間的誤差，巧妙的將變量間的關(guān)系引入到模型的優(yōu)化目標(biāo)中，實現(xiàn)了在Non-autogressive的基礎(chǔ)預(yù)估框架下，考慮了預(yù)測結(jié)果之間的關(guān)系。同時，文中采用了動態(tài)權(quán)重，控制原始模型優(yōu)化loss和新增loss之間的權(quán)重。

本文轉(zhuǎn)載自??圓圓的算法筆記??，作者： Fareise ????

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

ICLR'24 | 對比學(xué)習(xí)引入全周期時間序列信息提升長周期時序預(yù)測效果

海因斯DK ? 4856瀏覽 ? 0回復(fù)
使用Transformer來進行時序預(yù)測可還行？

Syrupup ? 3206瀏覽 ? 0回復(fù)
TFB：2024最新時間序列預(yù)測Benchmark

海因斯DK ? 7138瀏覽 ? 0回復(fù)
一文匯總時序預(yù)測新思路——圖學(xué)習(xí)視角解決時間序列預(yù)測問題

海因斯DK ? 5815瀏覽 ? 0回復(fù)
Transformer頻域消偏提升時序預(yù)測準(zhǔn)確性

海因斯DK ? 4404瀏覽 ? 0回復(fù)
時間序列預(yù)測+NLP大模型新作：為時序預(yù)測自動生成隱式Prompt

海因斯DK ? 3653瀏覽 ? 0回復(fù)
如何改良基于Basis的時間序列預(yù)測模型？

海因斯DK ? 3123瀏覽 ? 0回復(fù)
一文匯總：時序預(yù)測中的多頻率建模方法

海因斯DK ? 3669瀏覽 ? 0回復(fù)
高維多變量下的Transformer時序預(yù)測建模方法

海因斯DK ? 3766瀏覽 ? 0回復(fù)
一文梳理Transformer在時間序列預(yù)測中的發(fā)展歷程代表工作

海因斯DK ? 7748瀏覽 ? 0回復(fù)
時序預(yù)測中的多類型模型組合建模方案

海因斯DK ? 3369瀏覽 ? 0回復(fù)
時序預(yù)測數(shù)據(jù)處理新方法匯總：多粒度和頻域的可逆歸一化

海因斯DK ? 4457瀏覽 ? 0回復(fù)
NeurIPS'24：針對時序預(yù)測中時間戳特征的研究

海因斯DK ? 3773瀏覽 ? 0回復(fù)
LLM解決時間序列問題之語言模型+時序模型的對齊與融合建模

海因斯DK ? 4122瀏覽 ? 0回復(fù)
通道間關(guān)系建模在不規(guī)則時序預(yù)測中的研究

海因斯DK ? 3016瀏覽 ? 0回復(fù)
時序+圖像+文本，多模態(tài)增強的時序預(yù)測模型

海因斯DK ? 6180瀏覽 ? 0回復(fù)
專門針對時間序列分類任務(wù)的時序大模型

海因斯DK ? 3948瀏覽 ? 0回復(fù)
連續(xù)小波變換（CWT）+時間序列預(yù)測！融合時頻分析與深度學(xué)習(xí)的預(yù)測新思路

Tang_Lan ? 3442瀏覽 ? 0回復(fù)
時序Pattern提取+語義對齊增強基于LLM的時序預(yù)測效果

海因斯DK ? 2691瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

ICML'25 | 兼容不同數(shù)據(jù)源周期性差異的時間序列基礎(chǔ)模型 8天前發(fā)布
中科大&騰訊：通過提升各個專家網(wǎng)絡(luò)差異性提升基于MoE的CTR預(yù)估效果 8天前發(fā)布

熱門推薦

從原理到調(diào)參，小白也能讀懂的大模型微調(diào)LoRA，不懂線性代數(shù)也沒問題 0回復(fù)

Deepseek R1 0528實測：性能直逼頂尖，普通電腦本地運行全攻略 0回復(fù)

本命周！MiniMax M1有多猛？網(wǎng)友：僅用40k思考預(yù)算就干翻Gemini，實測：真·超DS！ 1回復(fù)

AI Agents開源工具棧全解析~ 0回復(fù)

效果&成本雙突破！快手提出端到端生成式推薦系統(tǒng)OneRec！ 0回復(fù)

上一篇：預(yù)訓(xùn)練大語言模型對時間序列預(yù)測真的有用嗎？去掉預(yù)訓(xùn)練LLM效果反而提升

下一篇：序列建模中Next Item Prediction的代表性工作

社區(qū)精華內(nèi)容

目錄

<style id="pby9j"></style>

<bdo id="pby9j"><rp id="pby9j"></rp></bdo>
<style id="pby9j"></style>