偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

語(yǔ)音合成模型Uni-TTS升級(jí):一音色多語(yǔ)言,高保真高效率

人工智能 語(yǔ)音識(shí)別
日前,微軟發(fā)布最新 Azure 神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成技術(shù)Uni-TTSv3多語(yǔ)言語(yǔ)音合成模型。與上一代語(yǔ)音合成模型相比,Uni-TTSv3語(yǔ)音合成保真度更高、速度更快、訓(xùn)練時(shí)間更短,更降本增效。

   日前,微軟發(fā)布最新 Azure 神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成技術(shù)Uni-TTSv3多語(yǔ)言語(yǔ)音合成模型。與上一代語(yǔ)音合成模型相比,Uni-TTSv3語(yǔ)音合成保真度更高、速度更快、訓(xùn)練時(shí)間更短,更降本增效。借助Uni-TTSv3,微軟升級(jí)美語(yǔ)合成女聲 Jenny。全新升級(jí)的Jenny Multilingual Neural,擁有跨語(yǔ)言能力,支持14個(gè)國(guó)家和地區(qū)的語(yǔ)言。此外,基于Uni-TTSv3而構(gòu)建的深度神經(jīng)網(wǎng)絡(luò)定制語(yǔ)音服務(wù),也擴(kuò)展了跨語(yǔ)言定制服務(wù)功能,客戶只需提供一個(gè)語(yǔ)言的錄音數(shù)據(jù)作為語(yǔ)料,即可訓(xùn)練定制模型同時(shí)說多個(gè)語(yǔ)言。

  Jenny Multilingual Neural音頻示例

  隨著技術(shù)不斷迭代,微軟智能語(yǔ)音性能已能媲美真人,并支持超過110個(gè)國(guó)家和地區(qū)的語(yǔ)言,提供超過270個(gè)神經(jīng)網(wǎng)絡(luò)聲音。為進(jìn)一步拓寬語(yǔ)音使用場(chǎng)景,滿足各行業(yè)客戶的多元化需求,微軟智能語(yǔ)音也在不斷探索新的服務(wù)和能力:

  l 跨語(yǔ)種語(yǔ)音技術(shù)需求:僅用一個(gè)音色就能生成同時(shí)覆蓋全球用戶的多語(yǔ)言應(yīng)用需求,譬如在虛擬游戲中創(chuàng)建具有多語(yǔ)言能力的 NPC (Non-Player Character ,非玩家角色),在智能客服等場(chǎng)景中使用多種語(yǔ)言與用戶交談,提升用戶體驗(yàn)。

  l 穩(wěn)定高效的平臺(tái)需求:使語(yǔ)音模型更加魯棒(robust,系統(tǒng)穩(wěn)定性),即使在定制服務(wù)場(chǎng)景中,也可以不受外界環(huán)境影響,穩(wěn)定、高效的處理不同類型的訓(xùn)練數(shù)據(jù)。

  新一代神經(jīng)網(wǎng)絡(luò)語(yǔ)音合成技術(shù)Uni-TTSv3的提出,旨在解決上述訴求并完善如下功能:

  保真度高

  Uni-TTSv3是非自回歸語(yǔ)音合成模型,基于FastSpeech 2(快速高質(zhì)量語(yǔ)音合成模型) 構(gòu)建,通過直接使用真實(shí)語(yǔ)音進(jìn)行訓(xùn)練,并引入更多有關(guān)語(yǔ)速、語(yǔ)調(diào)、重音模式等語(yǔ)音變化信息,提高合成語(yǔ)音質(zhì)量。經(jīng)行業(yè)公認(rèn)的、專業(yè)評(píng)估語(yǔ)音自然度的 MOS(Mean Opinion Score平均意見評(píng)分)評(píng)測(cè)結(jié)果顯示,智能合成女聲Jenny Multilingual Neural 的各語(yǔ)種語(yǔ)音平均評(píng)分達(dá)到 4.2 分以上(總分5分),語(yǔ)音保真度高。

Uni-TTSv3模型結(jié)構(gòu)圖

  多語(yǔ)言通用

  Uni-TTSv3是強(qiáng)大的多語(yǔ)言語(yǔ)音模型,在多語(yǔ)言和多說話人數(shù)據(jù)集上訓(xùn)練。Uni-TTSv3通過訓(xùn)練來(lái)自50多個(gè)不同地域和口音的發(fā)音人在不同場(chǎng)景下錄制的超過 3,000個(gè)小時(shí)的語(yǔ)音數(shù)據(jù),構(gòu)建多語(yǔ)言通用基礎(chǔ)語(yǔ)音模型,確保 AI 語(yǔ)音在語(yǔ)速、語(yǔ)調(diào)和重音模式等不變的情況下演繹多國(guó)語(yǔ)言。

  訓(xùn)練時(shí)間更短

  Uni-TTSv3授權(quán) Azure 語(yǔ)音合成平臺(tái)和自定義神經(jīng)語(yǔ)音支持多語(yǔ)種語(yǔ)音。借助Uni-TTSv3升級(jí)自定義神經(jīng)語(yǔ)音訓(xùn)練管道,支持客戶用更短的訓(xùn)練時(shí)間創(chuàng)建高質(zhì)量的語(yǔ)音模型。與上一代語(yǔ)音合成模型相比,Uni-TTSv3調(diào)優(yōu)過程簡(jiǎn)單,尤其在聲學(xué)訓(xùn)練部分, 訓(xùn)練時(shí)間顯著減少 50% 左右,更加降本增效。

Uni-TTSv3 模型訓(xùn)練示意圖

  想即刻試用體驗(yàn)Uni-TTSv3多語(yǔ)言語(yǔ)音合成模型嗎?想使用微軟 Azure 有聲內(nèi)容制作平臺(tái)制作高質(zhì)量合成語(yǔ)音嗎?請(qǐng)點(diǎn)此立即試用吧!

責(zé)任編輯:張潔 來(lái)源: 互聯(lián)網(wǎng)
相關(guān)推薦

2014-04-16 14:50:20

Spark

2023-08-09 09:36:04

Azure AI微軟

2024-03-04 14:15:16

OpenAI語(yǔ)言嵌入模型

2011-08-05 17:54:33

Cocoa Touch 多語(yǔ)言

2012-04-19 11:40:21

Titanium

2009-08-25 10:44:50

C#實(shí)現(xiàn)多語(yǔ)言

2014-07-09 09:20:06

WPFWPF應(yīng)用

2021-04-14 14:50:27

計(jì)算機(jī)模型 技術(shù)

2023-04-14 14:02:40

視覺AI

2024-05-09 08:14:09

系統(tǒng)設(shè)計(jì)語(yǔ)言多語(yǔ)言

2022-08-09 07:22:15

語(yǔ)言數(shù)據(jù)庫(kù)程序

2013-07-04 10:54:27

Windows 8.1系統(tǒng)升級(jí)

2009-11-09 15:55:41

2023-08-04 10:18:15

2023-01-09 13:18:59

AI

2021-06-29 21:48:32

開源語(yǔ)言架構(gòu)

2021-09-07 10:17:35

iOS多語(yǔ)言適配設(shè)計(jì)

2010-03-21 19:05:19

微軟MSF

2018-08-17 09:27:17

Photon數(shù)據(jù)爬蟲
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)