偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<sub id="3n6qf"><p id="3n6qf"><form id="3n6qf"></form></p></sub>

<ruby id="3n6qf"></ruby>

<abbr id="3n6qf"></abbr>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

虛擬歌手背后看不見(jiàn)的手 AI已掌控未來(lái)音樂(lè)？

作者：于佳卉 2023-09-05 14:15:03

AI技術(shù)的加持，讓音樂(lè)開(kāi)始走向了前所未有的形態(tài)。但任何一種新產(chǎn)品能否生存的核心都不僅是技術(shù)，更在于能否建立完善的商業(yè)模式。

19世紀(jì)以前，當(dāng)人們聚集在一起時(shí)，總是會(huì)用即時(shí)的最原始的歌聲和樂(lè)器，講述生活的故事，傳遞情感和思想。那時(shí)的音樂(lè)，是流動(dòng)的，也是瞬間的。

1857年之后,錄音的出現(xiàn)，讓人們擁有了隨時(shí)隨地欣賞優(yōu)秀的音樂(lè)作品的條件，在這種形式下，音樂(lè)開(kāi)始變成設(shè)定好的故事，聽(tīng)眾成了被動(dòng)的接受者。

斗轉(zhuǎn)星移。

時(shí)間來(lái)到2023，人工智能正在改變音樂(lè)的形態(tài)——通過(guò)便捷的操作，普通大眾可以輕松生產(chǎn)出音樂(lè)作品。從“play guitar”到“play AI”，音樂(lè)創(chuàng)作正變得觸手可及。

資深分析師Mark Mulligan觀察音樂(lè)產(chǎn)業(yè)數(shù)十載，不久前，他在博客中寫(xiě)道：“音樂(lè)產(chǎn)業(yè)來(lái)到了一個(gè)臨界點(diǎn)，AI將會(huì)改變音樂(lè)的未來(lái)，如今瓶中的精靈已經(jīng)飛向了廣闊的天空。”

合成的“歌唱?dú)v史”

作為歌迷的你可能不會(huì)想到，今年最火的音樂(lè)中，有一首竟然是孫燕姿演唱的“發(fā)如雪”?；蛘邷?zhǔn)確的說(shuō)，是AI孫燕姿。

突然走紅的另類“發(fā)如雪”，掀起了一陣網(wǎng)絡(luò)創(chuàng)作熱潮，帶動(dòng)AI歌手概念出圈，也讓更多人感受到人工智能在音樂(lè)領(lǐng)域的巨大潛力。

不過(guò)，說(shuō)到AI歌手，很多人第一反應(yīng)應(yīng)該是當(dāng)紅虛擬歌姬——初音未來(lái)、洛天依。在歌迷感慨于這些無(wú)論是聲音和容貌都接近完美的AI歌手時(shí)，絕大多數(shù)人可能并不知道，單純用計(jì)算機(jī)合成音樂(lè)這件事，早在上世紀(jì)五十年代就已經(jīng)出現(xiàn)了。根據(jù)不完全統(tǒng)計(jì)，歌聲合成的歷史沿革已經(jīng)跨越了70年。

1951年	程序員Christopher Strachey使用艾倫·圖靈的大型計(jì)算機(jī)制作了歷史上第一首電腦合成的音樂(lè)。
1961年	計(jì)算機(jī)音樂(lè)大師Max Mathews與科學(xué)家John Kelly等人使用IBM 704計(jì)算機(jī)完成了第一首由電腦模擬人聲演唱的歌曲《Daisy Bell》。
1982年	為了統(tǒng)一標(biāo)準(zhǔn)，并建立起一種連接電子樂(lè)器和計(jì)算機(jī)的規(guī)則，國(guó)際樂(lè)器制造者協(xié)會(huì)的十幾家廠商制定了通用合成器接口方案，更名為“音樂(lè)設(shè)備數(shù)字接口(MIDI)”。
2004年	日本雅馬哈株式會(huì)社（YAMAHA）授權(quán)ZERO-G發(fā)售了VOCALOID首個(gè)聲庫(kù)。
2007年	VOCALOID 2發(fā)布，日本CRYPTON FUTURE MEDIA公司依托該技術(shù)發(fā)布了初音未來(lái)。初音未來(lái)首次開(kāi)啟了聲庫(kù)+虛擬形象的軟件銷售模式，其意外爆火也激活了以UGC為核心的VOCALOID創(chuàng)作文化。
2009年	名古屋工業(yè)大學(xué)開(kāi)發(fā)的Sinsy（Singing Voice Synthesis System）語(yǔ)音合成系統(tǒng)發(fā)布，使用了隱馬爾科夫模型（HMM），可調(diào)教性別參數(shù)、顫音強(qiáng)度及變調(diào)等參數(shù)。
2012年	上海禾念公布洛天依等角色，并宣布第一款中文歌聲庫(kù)將以洛天依開(kāi)發(fā)。
2013年	CeVIO Creative Studio發(fā)布，基于HTS引擎（語(yǔ)音）/Sinsy引擎（歌唱）制作，輸入音符、文字后既能唱歌，還能模擬人聲說(shuō)話。
2018年	華侃如發(fā)售Synthesizer V editor，結(jié)合人工神經(jīng)網(wǎng)絡(luò)和采樣拼接合成的混合算法，使用底層語(yǔ)音模型（LLSM）技術(shù)實(shí)現(xiàn)了高還原度下對(duì)聲色的靈活修改。
2019年	時(shí)域科技推出了ACE虛擬歌姬，最開(kāi)始是一款音游。
2020年	? Synthesizer V Studio發(fā)布，12月Synthesizer V AI發(fā)布，使用基于深度神經(jīng)網(wǎng)絡(luò)的歌聲合成技術(shù)，生成的歌聲宛如人類歌手。 ? X Studio發(fā)布，由小冰公司開(kāi)發(fā)，軟件為音樂(lè)創(chuàng)作者提供具有不同音色和唱腔的虛擬歌手，它們能迅速讀懂樂(lè)譜并演唱出來(lái)。
2021年	? ACE開(kāi)始支持AI歌聲合成，并完成數(shù)百萬(wàn)美元Pre-A輪融資。 ? CeVIO AI發(fā)行，繼承了前身CeVIO Creative Studio結(jié)合歌聲合成與語(yǔ)音合成的特征，并采用了深度神經(jīng)網(wǎng)絡(luò)等AI技術(shù)。 ? 浙江大學(xué)發(fā)布了關(guān)于diffsinger的論文。diffsinger因其開(kāi)源免費(fèi)和高音質(zhì)的特點(diǎn)迅速吸引了一批忠實(shí)用戶。
2022年	? VoiSona首個(gè)正式版發(fā)布，VoiSona是CeVIO AI的“姊妹版”，由同一家公司開(kāi)發(fā)，分開(kāi)運(yùn)營(yíng)。 ? ACE發(fā)布電腦端ACE Studio預(yù)覽視頻，并開(kāi)啟內(nèi)測(cè)申請(qǐng)。 ? ACE官宣為“洛天依ACE AI”聲庫(kù)提供技術(shù)支持，同年為言和、樂(lè)正綾提供AI聲庫(kù)。
2023年	? 小冰與網(wǎng)易云音樂(lè)合作發(fā)布了新編輯器“網(wǎng)易云音樂(lè)·X Studio”，提供了13名虛擬歌手。 ? ACE Studio在直播問(wèn)答中稱新的歌聲合成模型和代碼重構(gòu)正在穩(wěn)步推進(jìn)中，商業(yè)化時(shí)機(jī)根據(jù)工作進(jìn)度而定。

在歌聲合成漫長(zhǎng)而隱秘的“進(jìn)化”中，AI歌手的出現(xiàn)可謂劃時(shí)代的產(chǎn)品，而要透析這段成長(zhǎng)歷史，有兩個(gè)關(guān)鍵的信息點(diǎn)是必須了解的：

第一，AI歌手涉及的技術(shù)主要有兩大類：歌聲合成（Singing Voice Synthesis，SVS）和歌聲轉(zhuǎn)換（Singing Voice Conversion，SVC），而主要的發(fā)展是在歌聲合成即SVS上。第二，總的來(lái)說(shuō)，歌聲合成可以分為拼接合成和AI合成兩大方向，從發(fā)展過(guò)程看，是由前者逐漸向后者演進(jìn)。

被公眾熟知的明星虛擬歌姬——初音未來(lái)和洛天依，在技術(shù)上使用的正是拼接合成的方式，并在最初采用的是VOCALOID引擎（軟件）。這類拼接合成引擎依靠手動(dòng)調(diào)校，可調(diào)節(jié)的參數(shù)和調(diào)節(jié)的精準(zhǔn)度，會(huì)直接影響創(chuàng)作效果——完全手動(dòng)調(diào)校對(duì)于新手來(lái)說(shuō)入門難，制作需要花費(fèi)更多精力。

UP主你ADC我輔助表示，由于拼接合成是通過(guò)對(duì)不同發(fā)音的錄入、編排和拼接來(lái)合成歌聲，具備音域?qū)?、編輯自由度高的?yōu)點(diǎn)，但連貫度會(huì)有所欠缺，“畢竟本質(zhì)上就是一段段的音頻素材”。

從拼接合成到AI合成的轉(zhuǎn)變過(guò)程，可以說(shuō)是一種技術(shù)的革新。與傳統(tǒng)的拼接合成不同，AI合成是使用人工智能技術(shù)深度學(xué)習(xí)人聲樣本的唱法、發(fā)音、聲線、風(fēng)格等，推測(cè)出本人怎么唱進(jìn)而模仿。

2009年，名古屋工業(yè)大學(xué)開(kāi)發(fā)的Sinsy就使用了隱馬爾科夫模型，而后CeVIO在Sinsy基礎(chǔ)上開(kāi)發(fā)出輸入音符、文字就能唱歌說(shuō)話的功能——這是最早使用非拼接方式的歌聲合成引擎。到了SynthesizerV發(fā)布時(shí)，技術(shù)上已經(jīng)開(kāi)始介入人工神經(jīng)網(wǎng)絡(luò)（模仿人類大腦活動(dòng)的機(jī)器深度學(xué)習(xí)模式），也就是說(shuō)其在拼接合成的基礎(chǔ)上結(jié)合了人工智能技術(shù)，融合了兩者的優(yōu)勢(shì)。

微軟小冰X studio也是早期AI引擎之一，免費(fèi)使用但目前落后于其他引擎。相比之下，ACE作為完全的后起之秀，性能效果與Synthesizer V同屬第一梯隊(duì)，去年5月，洛天依也宣布與ACE合作推出了ACE引擎聲庫(kù)，早期ACE還提供了音樂(lè)創(chuàng)作社區(qū)。

AI合成引擎通過(guò)人工智能計(jì)算自動(dòng)合成的聲音，往往不需要大改就能使用（也可以直接在計(jì)算結(jié)果的基礎(chǔ)上修改參數(shù)）——這一方面降低了制作成本；另一方面生成的聲音非常自然、流暢、擬真，操作門檻低。

不過(guò)UP主@HarryKamski介紹說(shuō)，AI合成的缺點(diǎn)是音域會(huì)受限，而且因?yàn)楹铣煞绞椒秋@性，會(huì)有“自己的想法”，很多時(shí)候不能完全遵照調(diào)校師的想法。

“AI孫燕姿”背后的歌聲轉(zhuǎn)換

就在SVS歌聲合成在商業(yè)領(lǐng)域大行其道的同時(shí)，各種音樂(lè)社區(qū)內(nèi)，隱匿生長(zhǎng)的開(kāi)源幼苗也在茁壯成長(zhǎng)。并因幾個(gè)月前突然在網(wǎng)絡(luò)爆火的“AI孫燕姿”，將SVC（歌聲轉(zhuǎn)換）猛地推向了主流的道路。

“AI孫燕姿”與商用廣泛的SVS技術(shù)路線不同，采用的是歌聲轉(zhuǎn)換即SVC技術(shù)。兩者的技術(shù)原理和用戶生態(tài)都是不同的，談及兩者的區(qū)別時(shí)，UP主電漿果茶畫(huà)了一張圖。

UP主電漿果茶解釋說(shuō)，不管用SVS AI還是SVC生成音頻，首先都需要采集聲音做一個(gè)AI模型，采集的聲音質(zhì)量越高，模型輸出的音質(zhì)也就越高。有了模型之后，SVS只需要輸入文本和音符就能生成一個(gè)新的音頻，沒(méi)有其他干擾的話，這個(gè)音頻的音質(zhì)是不會(huì)變的。SVC模型生成內(nèi)容則需要先輸入一個(gè)既有音頻，如果你往一個(gè)很好的模型輸入一個(gè)糟糕的音頻，那么輸出來(lái)的音頻也是糟糕的。

也就是說(shuō)，“AI孫燕姿”這類AI歌手，本質(zhì)可以理解為AI加持的歌聲變聲器，它是將源音頻的音色、聲線替換為目標(biāo)歌手的，保留原來(lái)的歌詞、唱法、音調(diào)等，因此最后的呈現(xiàn)效果，很大程度上取決于源音頻的演唱水平。

相較SVS技術(shù)，SVC出現(xiàn)的時(shí)間并不久。早期日本發(fā)布過(guò)一款語(yǔ)音合成軟件Voiceroid，可以將輸入的文本轉(zhuǎn)換成語(yǔ)音朗讀，當(dāng)時(shí)主要應(yīng)用于一些游戲解說(shuō)、美食教程、伴讀等。但對(duì)于實(shí)時(shí)需求來(lái)說(shuō)，輸入文字并不方便，于是后來(lái)就出現(xiàn)了AI變聲器，比如，“塞壬VOICE”——這些當(dāng)時(shí)本質(zhì)上還是商業(yè)的閉源軟件?？梢哉f(shuō)，直到以VITS（語(yǔ)音合成模型）為基礎(chǔ)的這類開(kāi)源、免費(fèi)軟件出現(xiàn)，SVC才真正在社區(qū)中興起。

至于大火的“AI孫燕姿”誕生經(jīng)歷，這里要提到一個(gè)人，國(guó)內(nèi)歌聲合成愛(ài)好者Rcell，他基于VITS、SoftVC等項(xiàng)目開(kāi)發(fā)了AI語(yǔ)音轉(zhuǎn)換軟件so-vits-svc，“AI孫燕姿”等AI歌手正是基于此制作的。由于so-vits-svc開(kāi)源免費(fèi)，可以在本地訓(xùn)練，也因此被大家廣泛的使用——so-vits-svc之外，SVC軟件還有RVC、DiffSVC等。

除了“AI孫燕姿”的發(fā)如雪，SVC技術(shù)的興起給個(gè)人的音樂(lè)興趣帶來(lái)了更多的可能性。

今年3月，UP主你ADC我輔助在B站上傳了一首已故歌手本兮“演唱”的《反方向的鐘》，勾起無(wú)數(shù)90后的回憶殺，網(wǎng)友們紛紛在視頻下感慨追憶，留言7000多條。

UP主你ADC我輔助表示，“現(xiàn)在很多網(wǎng)友用SVC來(lái)訓(xùn)練各種人物的聲庫(kù)，比如動(dòng)漫角色、主播、明星，甚至身邊的親朋好友，只要你想，任何人的聲音都可以被訓(xùn)練，并不限于明星。由于SVC聲庫(kù)訓(xùn)練起來(lái)不算復(fù)雜，在二創(chuàng)中非常受歡迎?！?/p>

也正是如此，“AI孫燕姿”爆火后，“AI王菲”、“AI周杰倫”、“AI陳奕迅”紛紛上線，有人追求歌曲的適配，有人紀(jì)念去世歌手，也有人劍走偏鋒，讓郭德綱唱起了熱血日漫OP。

每一次有新的人工智能技術(shù)出來(lái)，都會(huì)引起一番AI取代人的問(wèn)題的討論。有人認(rèn)為，AI歌手的本質(zhì)其實(shí)更像鋼琴吉他一樣，是一種樂(lè)器，無(wú)論是將其打造成虛擬偶像，還是生產(chǎn)力工具，它都不能脫離于人而存在。當(dāng)然那些演唱能力很差的歌手，或許該有一些危機(jī)感。

AI歌手的商業(yè)版圖

不管AI歌手的本質(zhì)是什么，任何一種新產(chǎn)品能否生存的核心都不僅是技術(shù)，更在于能否建立完善的商業(yè)模式。

商業(yè)模式上，SVS打造的歌手主要是和IP產(chǎn)業(yè)、偶像產(chǎn)業(yè)結(jié)合，比如廣告代言、賣周邊、直播、開(kāi)演唱會(huì)、發(fā)行歌曲等。但虛擬偶像產(chǎn)業(yè)主要靠粉絲經(jīng)濟(jì)，圈子小眾，想吃肉的多，可想而知這門生意并不好做。

最火的初音未來(lái)和洛天依都屬于最早吃到螃蟹的，一個(gè)是第一個(gè)在世界范圍爆火；另一個(gè)則是第一個(gè)打開(kāi)中國(guó)市場(chǎng)的，因此吸引了大量粉絲。不過(guò)，與表面的火爆背后，AI歌手的成功其實(shí)鳳毛麟角，即使在二次元文化最盛行的日本，真正大獲成功的大概也只有以初音未來(lái)為代表的那幾個(gè)。

除了偶像化的商業(yè)模式，另一個(gè)營(yíng)收方向是聲庫(kù)銷售。UP主你ADC我輔助表示，官方發(fā)布的SVS聲庫(kù)絕大多數(shù)都是經(jīng)過(guò)配音員本人授權(quán)的，像SV AI、CeVIO AI等軟件的AI聲庫(kù)，多采用買斷制，以一個(gè)價(jià)格購(gòu)買后就能終身使用其AI合成服務(wù)。

此外，電漿果茶表示，現(xiàn)在相關(guān)公司也在嘗試拓寬市場(chǎng)邊界，比如跟生產(chǎn)力工具結(jié)合。上個(gè)月，日本AI社宣布將與Unity合作推出A.I.VOICE語(yǔ)音合成聲庫(kù)，和基于A.I.VOICE技術(shù)的Unity擴(kuò)展編輯器，讓用戶可以在Unity上直接合成語(yǔ)音內(nèi)容，無(wú)需在多個(gè)軟件切換。

相比之下，SVC的商業(yè)路徑更窄，雖然也有商業(yè)化軟件，但在已經(jīng)有很多開(kāi)源免費(fèi)SVC的情況下，如何突出商業(yè)SVC的優(yōu)勢(shì)，是一個(gè)主要問(wèn)題。同時(shí)由于制作門檻低，SVC頻道更加混亂，充斥大量低質(zhì)量作品，也引起了一些圈內(nèi)用戶的不滿。另一方面由于音頻的采集未經(jīng)過(guò)版權(quán)方同意，SVC的AI歌手對(duì)原歌手以及詞曲者都可能構(gòu)成侵權(quán)。

“灰色地帶”的陰影

版權(quán)爭(zhēng)議是AI歌手面臨的一個(gè)主要現(xiàn)實(shí)問(wèn)題。

對(duì)于歌手本人和唱片公司來(lái)說(shuō)，面對(duì)不間斷輸出的海量自制歌曲，進(jìn)行授權(quán)或起訴索賠并不可行，最優(yōu)的解決方案或許是將重點(diǎn)放在輸入側(cè)——讓AI工具從預(yù)先授權(quán)的數(shù)據(jù)集中學(xué)習(xí)。這樣唱片公司和出版商也有機(jī)會(huì)從中拓展?fàn)I收，音樂(lè)版權(quán)也可能迎來(lái)一個(gè)新的商業(yè)模式。

這樣的新商業(yè)模式并非空中樓閣。

根據(jù)近期報(bào)道，谷歌和環(huán)球音樂(lè)正在就授權(quán)AI使用藝人的聲音和音樂(lè)來(lái)創(chuàng)作歌曲進(jìn)行談判。知情人士稱，雙方的討論是圍繞AI技術(shù)在音樂(lè)版權(quán)方面達(dá)成合作伙伴關(guān)系，希望開(kāi)發(fā)一種工具，讓廣大粉絲可以合法地創(chuàng)作AI歌曲，向版權(quán)方付費(fèi)，歌手們可以自由選擇是否加入。目前磋商還處于早期階段，暫時(shí)不會(huì)推出產(chǎn)品。此外據(jù)透露，華納音樂(lè)也在與谷歌談判中。

版權(quán)之外，聲音合成還存在其他法律隱患。

聲音具有強(qiáng)烈的人身屬性，更是歌手賴以生存的根本。“聲音保護(hù)”也被寫(xiě)入《民法典》，根據(jù)《民法典》第1023條相關(guān)規(guī)定：“對(duì)姓名等的許可使用，參照適用肖像許可使用的有關(guān)規(guī)定。對(duì)自然人聲音的保護(hù)，參照適用肖像權(quán)保護(hù)的有關(guān)規(guī)定?！蹦敲次唇?jīng)本人允許，通過(guò)SVC技術(shù)偽造聲音，無(wú)疑是對(duì)其人身權(quán)益的損害。

UP主痕繼痕跡表示，“技術(shù)也可能會(huì)被用于不好的用途，比如某流量演員自身臺(tái)詞功底很弱，通過(guò)換聲把配音轉(zhuǎn)變成自己的，或者以后某歌手的歌都不是自己唱的，而是別人唱完變聲成自己的。”此外還可能偽造虛假的錄音、言論，進(jìn)行詐騙或者造謠誹謗他人——今年已有多起使用AI合成語(yǔ)音電詐的案例曝光。

法律和商業(yè)模式都是AI歌手發(fā)展過(guò)程中要過(guò)的關(guān)，但這并不影響其成為人工智能技術(shù)的一次重大應(yīng)用。AI歌手正在不斷拓展音樂(lè)創(chuàng)作的邊界，為音樂(lè)文化注入無(wú)限的可能性。

責(zé)任編輯：趙寧寧來(lái)源：至頂網(wǎng)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<pre id="9a5st"></pre><p id="9a5st"></p>