偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

信號模態(tài)分解方法(如VMD)與預測任務結合時,數(shù)據(jù)泄露問題需要謹慎處理

發(fā)布于 2025-5-9 00:38
瀏覽
0收藏

一、模態(tài)分解方法是否存在固有泄露?

  1. 分解方法的全局性
    大多數(shù)模態(tài)分解方法(如VMD、EMD)需要完整的信號輸入進行分解,其本質是通過全局優(yōu)化或迭代過程提取模態(tài)分量(IMF)。這意味著:

如果直接在整個數(shù)據(jù)集(含未來測試數(shù)據(jù))上分解,分解后的IMF會隱含未來信息。

在訓練階段使用這些IMF訓練模型時,模型會間接“看到”未來數(shù)據(jù),導致數(shù)據(jù)泄露。

  1. 泄露的根源
    泄露并非來自分解方法本身,而是來自不合理的預處理流程。若分解步驟在數(shù)據(jù)劃分(訓練集/測試集)之前進行,則必然引入未來信息,導致泄露。

二、泄露風險分析

假設流程如下:

  • 原始數(shù)據(jù)劃分為訓練集和測試集;
  • 整個數(shù)據(jù)集(含測試集)進行VMD分解;
  • 重構高頻/低頻分量;
  • 分別訓練預測模型,最終結果相加。

關鍵問題

  • 步驟2的分解過程使用了測試集數(shù)據(jù),導致分解后的IMF(包括訓練集的IMF)包含未來信息。
  • 訓練模型時,輸入的高頻/低頻分量已隱含測試集信息,導致模型過擬合,預測結果不可信。

三、如何避免泄露?

正確流程(無泄露方案)

  • 劃分數(shù)據(jù):將數(shù)據(jù)嚴格分為訓練集(歷史數(shù)據(jù))和測試集(未來數(shù)據(jù)),禁止測試集參與任何預處理。
  • 僅在訓練集上分解

對訓練集進行VMD分解,確定分解參數(shù)(如模態(tài)數(shù)、中心頻率);

重構高頻/低頻分量。

  • 訓練預測模型:使用訓練集的分解結果訓練高頻/低頻預測模塊。
  • 測試階段處理
  • 對測試集數(shù)據(jù),需僅用訓練階段確定的分解參數(shù)進行分解。
  • 若VMD無法局部應用(需全局信號),需通過滾動窗口或在線分解(如實時更新歷史窗口)避免使用未來數(shù)據(jù)。
  • VMD的局限性:VMD需要全局優(yōu)化,難以分塊處理。若必須用VMD,可采用以下妥協(xié)方案:

滾動分解:每次預測時,僅用當前時刻前的歷史數(shù)據(jù)重新分解,逐步擴展窗口。

犧牲分解質量:短窗口可能導致模態(tài)不穩(wěn)定,但可避免泄露。

  • 替代方法:選擇支持在線分解的算法(如Online-EMD),或改用濾波類方法(如小波變換)。

本文轉載自????高斯的手稿???,作者:哥廷根數(shù)學學派

收藏
回復
舉報
回復
相關推薦