偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

折騰半天,我終于找到最懂中文的 AI 音頻產(chǎn)品

人工智能
今天,我想繼續(xù)來(lái)完善 AI 視頻案例。用 MiniMax語(yǔ)音的音頻能力,給我的花木蘭視頻,配上合適的音頻。

最近我注意到一個(gè)趨勢(shì):各大短視頻平臺(tái)上,AI 生成的內(nèi)容慢慢多了起來(lái),而且其中有很多創(chuàng)意不錯(cuò)的內(nèi)容,點(diǎn)贊和評(píng)論數(shù)據(jù)都很好。用 AI 來(lái)去制作一些之前沒(méi)辦法實(shí)現(xiàn),或者實(shí)現(xiàn)成本很高的內(nèi)容,我感覺(jué)這里面是有機(jī)會(huì)的。

上個(gè)月,我曾經(jīng)做過(guò)一個(gè) Demo,思路是利用最新的 AI 工具,通過(guò)視頻的方式來(lái)重新演繹中國(guó)歷史上那些經(jīng)典老故事,比如女?huà)z補(bǔ)天、牛郎織女、岳飛抗金、花木蘭替父從軍、貍貓換太子、穆桂英掛帥、梁山伯與祝英臺(tái)。

今年,AI 在多模態(tài)方面取得了十足的進(jìn)展。我判斷做這事的時(shí)機(jī)到了。視頻不難做,目前行業(yè)內(nèi)有不少的視頻模型,生成的效果基本能夠?qū)崿F(xiàn)我剛剛提到的構(gòu)想。但視頻畫(huà)面只是一部分,完整的視頻還包括貼切的配音。

那次和團(tuán)隊(duì)熬夜做完視頻后,我發(fā)現(xiàn)在國(guó)內(nèi)外比較難找到好的 AI 音頻類(lèi)產(chǎn)品。

ElevenLabs 是全球知名的 AI 音頻創(chuàng)業(yè)公司,但測(cè)試后,我們發(fā)現(xiàn)它在中文方面的表現(xiàn)實(shí)在難以令人滿(mǎn)意,它對(duì)中文語(yǔ)義的理解比較弱,而且在很多字句上,機(jī)器味比較明顯。折騰半天,結(jié)果很讓人失望。

昨天,我和團(tuán)隊(duì)無(wú)意間發(fā)現(xiàn)了一個(gè)國(guó)產(chǎn)寶藏產(chǎn)品,MiniMax 語(yǔ)音。下面是鏈接:https://www.minimaxi.com/audio

說(shuō)起來(lái)有點(diǎn)慚愧,MiniMax 的視頻生成和通用 Agent 我一直在用,但音頻生成產(chǎn)品還真沒(méi)怎么注意過(guò)。六月時(shí),MiniMax 發(fā)布了新一代語(yǔ)音大模型 Speech-02,最大的亮點(diǎn)就是語(yǔ)音合成效果接近真人,而且還能還原停頓、重音強(qiáng)調(diào)等表達(dá)細(xì)節(jié)。

這個(gè)模型曾經(jīng)拿下 Artificial Arena 和 Huggingface 的榜單第一,語(yǔ)音相似度(SIM)在各種語(yǔ)言中表現(xiàn)都不錯(cuò),尤其是在中文、粵語(yǔ)、日語(yǔ)這些亞洲語(yǔ)言上,準(zhǔn)確率和表現(xiàn)直接把 ElevenLabs 甩開(kāi)了一大截。

今天,我想繼續(xù)來(lái)完善 AI 視頻案例。用 MiniMax語(yǔ)音的音頻能力,給我的花木蘭視頻,配上合適的音頻。

《木蘭辭》大家肯定耳熟能詳,現(xiàn)在我兒子都倒背如流。這首詩(shī)確實(shí)寫(xiě)得好,很容易讓人記住。但讓 AI 來(lái)朗誦并沒(méi)那么簡(jiǎn)單。因?yàn)槟咎m辭全詩(shī)中,不同部分表達(dá)的情緒是不一樣的。

比如開(kāi)頭幾句,主要是寫(xiě)木蘭在家織布,聽(tīng)到征兵的消息后,內(nèi)心焦急、憂愁、思慮父親年老,決心代父從軍。如果朗讀的話,應(yīng)該表現(xiàn)出來(lái)花木蘭的憂愁和勇氣。

緊接著是從軍準(zhǔn)備,描寫(xiě)木蘭買(mǎi)馬、備鞍、辭別家人。這一段既有出征的決絕,也帶著告別親人的柔情。情感比較復(fù)雜,需要表達(dá)出她的眷戀。

再后面是沙場(chǎng)征戰(zhàn),這里寫(xiě)木蘭在軍隊(duì)中的艱苦、跋涉、奮戰(zhàn)....總之,不同的內(nèi)容,需要的情感是不一樣的,如果用一個(gè)調(diào)讀下來(lái),那自然很假。

我們團(tuán)隊(duì)用 MiniMax 語(yǔ)音,僅花了兩個(gè)小時(shí)時(shí)間,完美生成了自己中意的音頻。先給大家聽(tīng)聽(tīng)效果。

你應(yīng)該能感覺(jué)出來(lái),我按照自己對(duì)這首詩(shī)的理解,讓 AI 來(lái)演繹對(duì)應(yīng)的情感。該眷戀的時(shí)候突出眷戀,該果敢的時(shí)候則突出果敢。至此,我終于找到一款好用的 AI 音頻產(chǎn)品了。

接下來(lái)講講我是怎么做的。

整體來(lái)說(shuō),分三步。

第一步是音色設(shè)計(jì)。音色,其實(shí)就是聲音給人的第一感覺(jué),是男是女,是年輕還是成熟,是清亮還是低沉,每個(gè)人說(shuō)話都有自己的底色。

第二步再把內(nèi)容拆分成小段,然后針對(duì)每一段去微調(diào)音色和情緒,讓表達(dá)更貼近內(nèi)容本身。

最后一步就簡(jiǎn)單了,我們用工具把所有的音頻片段拼在一起,形成一條完整的語(yǔ)音。

進(jìn)入 MiniMax 語(yǔ)音主頁(yè)(直接搜索 MiniMax,點(diǎn)擊語(yǔ)音大模型也可以直接進(jìn)入),點(diǎn)擊左側(cè)的“音色設(shè)計(jì)”菜單,可以通過(guò)提示詞來(lái)設(shè)計(jì)自己期望的音色。

如果不知道提示詞怎么寫(xiě),那也可以直接選擇提示詞輸入框下方的預(yù)定義角色,官方已經(jīng)預(yù)置了一些提示詞模板,我們可以在此基礎(chǔ)上優(yōu)化。

點(diǎn)擊音色生成按鈕后,系統(tǒng)會(huì)直接給出三個(gè)備選的音色。哪個(gè)更貼近自己的預(yù)期,選哪個(gè)就好。

因?yàn)槲业哪繕?biāo)是給《木蘭辭》配音,所以在進(jìn)行音色設(shè)計(jì)時(shí),我輸入了以下提示詞:

女聲,堅(jiān)定而柔和,堅(jiān)毅中帶溫柔;語(yǔ)氣自然、有力量,充滿(mǎn)忠誠(chéng)與家國(guó)情懷;適合古代英勇女性角色;帶有輕微古風(fēng)韻味,但不過(guò)度夸張;表達(dá)清晰,情感豐富,可傳達(dá)隱忍、果斷與柔情交織的情緒。

最終生成的音色我們可以在音色庫(kù)中找到:

其實(shí)到這一步,音色設(shè)計(jì)就已經(jīng)完成了。接下來(lái),就要進(jìn)入到最最重要的第二步了。不過(guò)在正式介紹音頻制作過(guò)程前,我先分享幾個(gè)我認(rèn)為 MiniMax 語(yǔ)音很貼心的設(shè)計(jì)細(xì)節(jié)。

第一,MiniMax 語(yǔ)音支持對(duì)句子之間的停頓時(shí)間進(jìn)行精確控制。以前我用其他 AI 工具生成音頻,經(jīng)常遇到 AI 不會(huì)合理分配停頓位置和時(shí)長(zhǎng),聽(tīng)起來(lái)總覺(jué)得不自然。這事其實(shí)挺麻煩,過(guò)去我們只能靠手動(dòng)剪輯去補(bǔ)救。

而 MiniMax 語(yǔ)音考慮到了這一點(diǎn),如果我們需要在哪句話后面停頓,只要插入一個(gè)指令就行。舉個(gè)例子,比如我想在某個(gè)詞后停頓 0.8 秒,直接插入 '<#0.8#>' 指令。非常簡(jiǎn)單。

第二,在生成過(guò)程中,它支持對(duì)音色效果和情緒進(jìn)行細(xì)微的調(diào)節(jié)。這一點(diǎn)對(duì)我而言,太有用了。要不然,想讓 AI 通過(guò)一個(gè)音色來(lái)詮釋不同情感的內(nèi)容,挺難。

下面進(jìn)入音頻制作具體過(guò)程。我對(duì)《木蘭辭》進(jìn)行了結(jié)構(gòu)和情緒上的拆分。

全詞大致可以分為七個(gè)部分:開(kāi)頭是平靜的敘述,隨后是看到征兵時(shí)的憂傷,決定替父從軍時(shí)的果斷,出征準(zhǔn)備時(shí)的溫情,沙場(chǎng)征戰(zhàn)時(shí)的激烈與英勇,凱旋歸來(lái)后的釋然與平靜,最后是與家人團(tuán)聚時(shí)的溫馨和自豪。

每一部分的情緒和表達(dá)方式都各不相同,因此我在制作時(shí)也會(huì)針對(duì)不同情感進(jìn)行分段處理。

先來(lái)看第一部分的內(nèi)容:唧唧復(fù)唧唧,木蘭當(dāng)戶(hù)織。不聞機(jī)杼聲,唯聞女嘆息。

這兩句話主要是對(duì)花木蘭日常狀態(tài)的平靜描寫(xiě),情緒相對(duì)平穩(wěn)。因此在音頻生成時(shí),我沒(méi)有對(duì)輸出情緒做過(guò)多調(diào)整。但為了讓語(yǔ)音聽(tīng)起來(lái)更自然,我在兩句話之間特意插入了 0.4 秒的停頓('<#0.4#>'),讓表達(dá)更有層次感。

與此同時(shí),我還在右側(cè)的調(diào)試臺(tái),單獨(dú)調(diào)整了音色效果。你看下方界面,有點(diǎn)像美顏軟件調(diào)整一張照片的曝光、鮮明度、亮度等細(xì)節(jié),我可以調(diào)整聲音效果,讓它更低沉,或者更有力量感。

下面是 MiniMax 語(yǔ)音生成的效果:

作為對(duì)比,我用 ElevenLabs 也做了一次測(cè)試。你一聽(tīng)就能知道差距。

ElevenLabs 好像很多漢字不認(rèn)識(shí),遇到點(diǎn)生僻字時(shí)就亂了,比如第一句機(jī)杼聲的杼字,它就念錯(cuò)了。而且它整體的表達(dá)狀態(tài)不像是純正的中文表達(dá),中間總是隔了怪怪的一層,說(shuō)不上來(lái)哪里不對(duì)勁。

現(xiàn)在來(lái)看,中文音頻的生成,還得是 MiniMax 語(yǔ)音這種更懂本土文化的產(chǎn)品做得更好。

我繼續(xù)演示下第二部分的音頻生成過(guò)程。第二部分的詩(shī)文內(nèi)容是:?jiǎn)柵嗡?,?wèn)女何所憶。女亦無(wú)所思,女亦無(wú)所憶。昨夜見(jiàn)軍帖,可汗大點(diǎn)兵,軍書(shū)十二卷,卷卷有爺名。

這一段主要描述花木蘭看到征兵告示時(shí)的無(wú)奈。沒(méi)辦法,家里父親老了,木蘭又沒(méi)大哥......她在醞釀一個(gè)重要的人生決定。生成這部分內(nèi)容的音頻時(shí),我把輸出情緒調(diào)整為“難過(guò)”,并適當(dāng)提升了音調(diào)。

同時(shí),我還對(duì)音色效果進(jìn)行了相應(yīng)調(diào)整,讓聲音更好地傳達(dá)出花木蘭當(dāng)時(shí)的心境。當(dāng)然,這個(gè)心境也是我的個(gè)人解讀。

做這個(gè)音頻的過(guò)程,還挺有意思,依稀想起小學(xué)還是初中時(shí),搖頭晃腦背誦詩(shī)文的場(chǎng)景。那時(shí)候哪能理解到花木蘭作為一個(gè)中年人的無(wú)奈和勇敢啊。

最終生成的音頻效果如下:

后續(xù)的各個(gè)部分制作過(guò)程大致相同,我就不一一介紹了。主要邏輯就是根據(jù)內(nèi)容,調(diào)整音色效果、輸出情緒和停頓位置。該輕松的時(shí)候語(yǔ)氣要輕松,該凝重的時(shí)候要凝重。

MiniMax 語(yǔ)音在產(chǎn)品層面已經(jīng)做了非常周全的封裝,沒(méi)什么上手難度,只要有耐心,做出一個(gè) 80 分的音頻其實(shí)不難。

第三步,把剛剛所有分段音頻合并,就能得到完整的音頻。

這次嘗試,我自己還是挺滿(mǎn)意的。像花木蘭這樣的經(jīng)典故事,過(guò)去要一群人合作、花不少精力才能做出來(lái),現(xiàn)在小團(tuán)隊(duì),甚至一個(gè)人,也能慢慢還原腦海里的那些畫(huà)面和情緒。

現(xiàn)在注冊(cè) MiniMax 語(yǔ)音官方會(huì)贈(zèng)送 1 萬(wàn)積分。這些積分大約能生成 12 分鐘的音頻,做一整首《木蘭辭》完全沒(méi)問(wèn)題,想嘗鮮的同學(xué)可以試試。

不過(guò),大家肯定也關(guān)心,長(zhǎng)期使用的話,他們的會(huì)員套餐劃不劃算。我橫向?qū)Ρ攘艘蝗κ忻嫔系囊纛l產(chǎn)品,MiniMax 語(yǔ)音的套餐選擇絕對(duì)是最靈活,性?xún)r(jià)比最高的,沒(méi)有之一。

另外,MiniMax 語(yǔ)音的計(jì)費(fèi)方式也很人性化,想用多少就買(mǎi)多少聲貝(積分),積分有效期還比月度員長(zhǎng)得多。比如最低的 10 萬(wàn)聲貝套餐,也就 20 塊,一頓外賣(mài)的錢(qián),隨用隨充,非常方便。

反觀 ElevenLabs,得 11 美元,而且只有一個(gè)月有效期。性?xún)r(jià)比高下立判,連老外都說(shuō) MiniMax 更良心。

AI 工具進(jìn)步得很快,很多原本以為麻煩的事情,現(xiàn)在已經(jīng)簡(jiǎn)單到只需要花點(diǎn)時(shí)間摸索就能搞定。

不少好點(diǎn)子,擱在以前都是想想就算了,現(xiàn)在真有機(jī)會(huì)試一試。也許你喜歡歷史,喜歡體育,喜歡地理,喜歡游戲,總之,你肯定有自己喜歡和擅長(zhǎng)的事情,也許可以結(jié)合自己的特點(diǎn),然后借助 AI 工具,創(chuàng)作一些好的內(nèi)容。

責(zé)任編輯:龐桂玉 來(lái)源: AI產(chǎn)品阿穎
相關(guān)推薦

2013-04-09 09:54:34

程序員

2022-12-01 15:22:02

AI阿里騰訊

2019-11-13 10:02:38

B樹(shù)MySQL索引

2020-10-13 10:19:30

Go工具Group

2020-10-19 08:20:44

技術(shù)管理轉(zhuǎn)型

2025-07-09 13:19:22

2012-12-10 10:21:32

2022-09-05 19:00:53

低代碼平臺(tái)React

2013-07-17 14:13:08

產(chǎn)品產(chǎn)品失敗

2020-11-19 07:54:32

程序員報(bào)警

2020-08-06 16:55:37

虛擬化底層計(jì)算機(jī)

2021-07-15 06:43:11

Module Fede開(kāi)發(fā)場(chǎng)景

2021-11-16 22:56:05

Windows 11Windows微軟

2016-01-18 09:53:36

蘋(píng)果ios

2025-07-15 08:43:00

2017-10-13 16:47:00

AI

2022-11-16 14:05:56

AI模型

2012-05-29 21:25:32

iOS

2017-12-26 11:00:17

iPhone果粉安卓
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)