偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI智能語音識(shí)別算法 下篇

人工智能 語音識(shí)別 算法

 [[397599]]

一、神經(jīng)網(wǎng)絡(luò)

當(dāng)前常用的語音識(shí)別框架如下圖

其背后的邏輯是

在特征提取時(shí)采用的神經(jīng)網(wǎng)絡(luò)里面的DNN技術(shù)

DNN技術(shù)可以分為兩種,一種是CNN模型,一種是RNN模型

二、解碼器

解碼器信息來源于聲學(xué)模型、詞典、語言模型。框圖如下:

2.1 聲學(xué)模型

常用的聲學(xué)模型為GMM-HMM,即混合高斯模型-隱馬爾科夫模型

HMM模型對(duì)時(shí)序信息進(jìn)行建模,在給定HMM的一個(gè)狀態(tài)后,GMM對(duì)屬于該狀態(tài)的語音特征向量的概率分布進(jìn)行建模。

2.2 詞典

字典:就是發(fā)音字典,中文中就是拼音與漢字的對(duì)應(yīng),英文中就是音標(biāo)與單詞的對(duì)應(yīng)

用途:

根據(jù)聲學(xué)模型識(shí)別出來的音素,在字典中來找到對(duì)應(yīng)的漢字(詞)或者單詞,用來在聲學(xué)模型和語言模型建立橋梁,將兩者聯(lián)系起來。

比方如下詞語的映射表:

2.3 語言模型

語言模型是針對(duì)某種語言建立的概率模型,是用來計(jì)算一個(gè)句子的概率的概率模型。

劃分以下兩種:

2.3.1 N元統(tǒng)計(jì)語言模型:N-gram模型、平滑化

2.3.2 神經(jīng)網(wǎng)絡(luò)語言模型:

與統(tǒng)計(jì)語言模型不同的是,神經(jīng)網(wǎng)絡(luò)語言模型不通過計(jì)數(shù)的方法對(duì)nn元條件概率進(jìn)行估計(jì),而是直接通過一個(gè)神經(jīng)網(wǎng)絡(luò)對(duì)其建模求解。

用途:

1、決定哪一個(gè)詞序列的可能性更大

2、已知若干個(gè)詞,預(yù)測(cè)下一個(gè)詞

例子:

1、I went to a party.

Eye went two a bar tea.

2、你現(xiàn)在在干什么?

責(zé)任編輯:梁菲 來源: 互聯(lián)網(wǎng)
相關(guān)推薦

2021-05-06 11:13:06

人工智能語音識(shí)別

2025-06-27 05:00:00

AI語音詐騙AI語音識(shí)別人工智能

2021-12-24 10:34:11

鴻蒙HarmonyOS應(yīng)用

2022-12-01 07:03:22

語音識(shí)別人工智能技術(shù)

2017-03-20 10:14:03

語音識(shí)別匹配算法模型

2023-07-06 08:41:20

TTS?Mac?系統(tǒng)

2022-09-08 19:09:02

人工智能語音命令

2020-09-21 07:00:00

語音識(shí)別AI人工智能

2024-08-19 08:07:52

2018-06-14 09:52:03

2022-09-08 14:19:34

人工智能智能家居智能家電

2019-05-21 09:53:57

機(jī)器人

2024-05-31 08:12:19

2011-05-31 16:38:47

Android 實(shí)現(xiàn)語音

2016-02-17 10:39:18

語音識(shí)別語音合成語音交互

2021-07-28 21:42:32

人工智能AI

2022-11-03 16:31:08

語音智能語音識(shí)別

2017-03-20 16:42:00

語音識(shí)別數(shù)據(jù)庫(kù)人工智能

2011-01-18 11:52:25

Linux語音識(shí)別
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)