偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<pre id="itsic"></pre>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏

作者：博雯 2021-09-22 09:25:38

寫歌填詞、改換風格、續(xù)寫音樂的AI，今天又來做編曲人了！

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

寫歌填詞、改換風格、續(xù)寫音樂的AI，今天又來做編曲人了！

上傳一段《Stay》，一鍵按下：

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

伴奏和人聲就輕松分離：

https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247594465&idx=3&sn=83a18be3019dbecd6040031618d112dc&chksm=e8d1c693dfa64f85e7db0f5157d533361da6c8b71a9ceacdfc29a28399bd6d0bade7a046014f&token=497180065&lang=zh_CN#rd

人聲頗有種在空曠地帶清唱的清晰感，背景樂都能直接拿去做混剪了！

這樣驚人的效果也引發(fā)了Reddit熱議：

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

這項研究的主要負責人孔秋強來自字節(jié)跳動，全球最大的古典鋼琴數據集GiantMIDI-Piano，也是由他在去年牽頭發(fā)布的。

那么今天，他又帶來了怎樣的一個AI音樂家呢？

一起來看看。

基于深度殘差網絡的音源分離

這是一個包含了相位估計的音樂源分離（MSS）系統(tǒng)。

首先，將幅值（Magnitude）與相位（Phase）解耦，用以估計復數理想比例掩碼（cIRM）。

其次，為了實現更靈活的幅值估計，將有界掩碼估計和直接幅值預測結合起來。

最后，為MSS系統(tǒng)引入一個143層的深度殘差網絡（Deep Residual UNets），利用殘差編碼塊（REB）和殘差解碼塊（RDB）來增加其深度：

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

殘差編碼塊和殘差卷積塊中間還引入了中間卷積塊（ICB），以提高殘差網絡的表達能力。

其中每個殘差編碼塊由4個殘差卷積塊（RCB）組成，殘差卷積塊又由兩個核大小為3×3的卷積層組成。

每個殘差解碼塊由8個卷積層和1個反卷積層組成。

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

實驗結果

接下來，將這一系統(tǒng)在MUSDB18數據集上進行實驗。

MUSDB18中的訓練/驗證集分別包含100/50個完整的立體聲音軌，包括獨立的人聲、伴奏、低音、鼓和其他樂器。

在訓練時，利用上述系統(tǒng)進行并行的混合音頻數據增強，隨機混合來自同一來源的兩個3秒片段，然后作為一個新的3秒片段進行訓練。

以信號失真率（SDR）作為評判標準，可以看到ResUNetDecouple系統(tǒng)在分離人聲、低音、其他和伴奏方面明顯優(yōu)于以前的方法：

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

在消融實驗中，143層殘差網絡的表現也證實了，結合有界掩碼估計和直接幅值預測確實能夠改善聲音源分離系統(tǒng)的性能。

字節(jié)博士搞的AI火了，一鍵完美分離人聲和伴奏 | 在線可玩

作者介紹

這項研究的論文一作為孔秋強，本碩都畢業(yè)于華南理工大學，博士則畢業(yè)于英國薩里大學的電子信息工程專業(yè)。

他在2019年加入字節(jié)跳動的Speech, Audio and Music Intelligence研究小組，主要負責音頻信號處理和聲音事件檢測等領域的研究。

論文：
https://arxiv.org/abs/2109.05418

試玩：
https://huggingface.co/spaces/akhaliq/Music_Source_Separation

開源地址：
https://github.com/bytedance/music_source_separation

參考鏈接：
https://www.reddit.com/r/MachineLearning/comments/pqpl7m/r_decoupling_magnitude_and_phase_estimation_with/

責任編輯：張燕妮來源：量子位

AI 數據人工智能

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營