偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

概述語(yǔ)音識(shí)別技術(shù)的發(fā)展及其應(yīng)用

譯文
人工智能 語(yǔ)音識(shí)別
在我們的生活中交流起著重要的作用。人類從符號(hào)開(kāi)始,然后發(fā)展到用語(yǔ)言交流,再后來(lái)出現(xiàn)了計(jì)算和通信技術(shù)。在某些情況下,機(jī)器不僅與人類交流,也與機(jī)器之間交流。計(jì)算機(jī)和通信技術(shù)創(chuàng)造了互聯(lián)網(wǎng)世界,正如我們所知的物聯(lián)網(wǎng)(IoT)。

[[280529]]

【51CTO.com快譯】在我們的生活中交流起著重要的作用。人類從符號(hào)開(kāi)始,然后發(fā)展到用語(yǔ)言交流,再后來(lái)出現(xiàn)了計(jì)算和通信技術(shù)。在某些情況下,機(jī)器不僅與人類交流,也與機(jī)器之間交流。計(jì)算機(jī)和通信技術(shù)創(chuàng)造了互聯(lián)網(wǎng)世界,正如我們所知的物聯(lián)網(wǎng)(IoT)。下面是涉及機(jī)器學(xué)習(xí)的語(yǔ)音識(shí)別技術(shù)的發(fā)展。

語(yǔ)音識(shí)別技術(shù)和機(jī)器學(xué)習(xí)的發(fā)展

互聯(lián)網(wǎng)催生了使用數(shù)據(jù)的新方式,這就是機(jī)器學(xué)習(xí)。我們可以通過(guò)訓(xùn)練機(jī)器直接或間接地與它們交流。在此之前,我們必須訪問(wèn)計(jì)算機(jī)來(lái)與機(jī)器通信。

人們開(kāi)始研究消除單純依賴計(jì)算機(jī)的技術(shù),這種技術(shù)稱為自動(dòng)語(yǔ)音識(shí)別?;谧匀徽Z(yǔ)言處理(NLP),我們可以在很大程度上直接與機(jī)器交互。

語(yǔ)音識(shí)別領(lǐng)域的初步研究已經(jīng)取得了成功。從那時(shí)起,語(yǔ)音科學(xué)家和工程師就致力于優(yōu)化語(yǔ)音識(shí)別引擎。根據(jù)實(shí)際情況優(yōu)化機(jī)器的交互,從而降低錯(cuò)誤率,提高效率。

一些機(jī)構(gòu)已經(jīng)開(kāi)始開(kāi)發(fā)微調(diào)語(yǔ)音識(shí)別技術(shù)。十多年來(lái),位于弗吉尼亞州的GoVivace公司一直致力于語(yǔ)音識(shí)別技術(shù)和解決方案的設(shè)計(jì)和開(kāi)發(fā)。

自動(dòng)語(yǔ)音識(shí)別及其應(yīng)用

自動(dòng)語(yǔ)音識(shí)別(ASR)技術(shù)是計(jì)算機(jī)科學(xué)和語(yǔ)言學(xué)兩個(gè)不同分支的結(jié)合。計(jì)算機(jī)科學(xué)用于設(shè)計(jì)算法和編寫(xiě)程序;語(yǔ)言學(xué)用于創(chuàng)建單詞,句子和短語(yǔ)的字典。

生成語(yǔ)音音標(biāo)

開(kāi)發(fā)的第一個(gè)階段是從語(yǔ)音轉(zhuǎn)錄開(kāi)始的,在這里音頻被轉(zhuǎn)換成文本——語(yǔ)音到文本的轉(zhuǎn)換。之后,系統(tǒng)過(guò)濾去除不需要的信號(hào)或噪聲。當(dāng)我們說(shuō)一個(gè)單詞或句子時(shí),我們有不同的語(yǔ)速,因此語(yǔ)音識(shí)別模型還需要考慮這些語(yǔ)速的變化。

隨后,信號(hào)被進(jìn)一步劃分以識(shí)別音素。音素是具有相同氣流水平的字母,如“b”和“p”。程序會(huì)通過(guò)與存儲(chǔ)在語(yǔ)言學(xué)詞典中的單詞和句子進(jìn)行比較,來(lái)試圖匹配準(zhǔn)確的單詞。

語(yǔ)音識(shí)別系統(tǒng)目前有兩種類型。

一種類型的系統(tǒng)是通過(guò)學(xué)習(xí)模式來(lái)完成的,另一種是作為人的依賴系統(tǒng)來(lái)完成的。隨著人工智能(AI)和大數(shù)據(jù)的發(fā)展,語(yǔ)音識(shí)別技術(shù)達(dá)到了一個(gè)新的水平。一種被稱為長(zhǎng)短時(shí)記憶的特殊神經(jīng)結(jié)構(gòu)在這一領(lǐng)域取得了顯著的進(jìn)步。在全球范圍內(nèi),很多機(jī)構(gòu)正在利用不同層次的語(yǔ)言能力來(lái)完成各種各樣的任務(wù)。

語(yǔ)音文本軟件可以將音頻文件轉(zhuǎn)換到文本文件。

許多國(guó)家沒(méi)有語(yǔ)言嵌入式鍵盤,大多數(shù)人都不知道如何使用特定的語(yǔ)言鍵盤,盡管他們?cè)谡Z(yǔ)言方面很擅長(zhǎng)。在這種情況下,語(yǔ)音轉(zhuǎn)錄幫助它們將語(yǔ)音轉(zhuǎn)換成任何語(yǔ)言的文本。

實(shí)時(shí)字幕系統(tǒng)。

這是一個(gè)實(shí)時(shí)的應(yīng)用系統(tǒng)。實(shí)時(shí)翻譯技術(shù)被稱為計(jì)算機(jī)輔助實(shí)時(shí)翻譯。它基本上是一個(gè)實(shí)時(shí)操作的語(yǔ)音到文本系統(tǒng)。世界各地舉辦各種會(huì)議都會(huì)應(yīng)用。

為了最大限度地吸引全球觀眾的參與,他們采用了直播字幕系統(tǒng)。實(shí)時(shí)字幕系統(tǒng)將語(yǔ)音轉(zhuǎn)換為文本并顯示在屏幕上。它可以將一種語(yǔ)言的演講翻譯成其他語(yǔ)言的文本,還可以幫助記錄會(huì)議或演講。這些系統(tǒng)將語(yǔ)音轉(zhuǎn)換成文本,使聽(tīng)力受限的人也能閱讀和理解。

語(yǔ)音生物識(shí)別系統(tǒng)

除了語(yǔ)音到文本,該技術(shù)還將其分支擴(kuò)展到生物識(shí)別系統(tǒng),從而為用戶身份驗(yàn)證創(chuàng)建了語(yǔ)音生物識(shí)別技術(shù)。語(yǔ)音生物識(shí)別系統(tǒng)分析說(shuō)話人的聲音,這取決于音調(diào)、發(fā)音和其他因素。

在這些系統(tǒng)中,首先分析語(yǔ)音樣本并存儲(chǔ)為模板。當(dāng)用戶說(shuō)出短語(yǔ)或句子時(shí),語(yǔ)音生物識(shí)別系統(tǒng)會(huì)將其與存儲(chǔ)的模板進(jìn)行比較,并提供身份驗(yàn)證。然而,這些系統(tǒng)面臨著許多挑戰(zhàn)。我們的聲音總是受到身體因素或情緒狀態(tài)的影響。

生物語(yǔ)音系統(tǒng)的最新發(fā)展是通過(guò)將短語(yǔ)與樣本進(jìn)行匹配來(lái)實(shí)現(xiàn)的。然后,結(jié)合心理和行為語(yǔ)音信號(hào)分析語(yǔ)音模式。此外,語(yǔ)音生物識(shí)別技術(shù)的發(fā)展將有助于那些數(shù)據(jù)安全備受關(guān)注的企業(yè)。

使用語(yǔ)音進(jìn)行分析

分析在語(yǔ)音識(shí)別技術(shù)的發(fā)展中起著至關(guān)重要的作用。大數(shù)據(jù)分析創(chuàng)造了存儲(chǔ)語(yǔ)音數(shù)據(jù)的需求。呼叫中心開(kāi)始使用電話錄音來(lái)培訓(xùn)他們的員工。因?yàn)榭蛻魸M意度現(xiàn)在是全球機(jī)構(gòu)的首要關(guān)注點(diǎn)?,F(xiàn)在,機(jī)構(gòu)希望跟蹤和分析主管和客戶之間的對(duì)話。

使用呼叫分析應(yīng)用程序,相關(guān)機(jī)構(gòu)可以監(jiān)視和測(cè)量呼叫的質(zhì)量。這種呼叫分析解決方案提高了呼叫中心提供的服務(wù)質(zhì)量。通過(guò)分析可以分類他們的客戶,可以更好地為客戶提供更快和更好的反饋。

語(yǔ)音識(shí)別技術(shù)還有很長(zhǎng)的路要走

語(yǔ)音識(shí)別技術(shù)的研究任重而道遠(yuǎn)。到目前為止,程序只能執(zhí)行指令。人類的交流感覺(jué)并不完全存在于機(jī)器中。研究人員正試圖向機(jī)器灌輸人類的反應(yīng)能力。它們?cè)谡Z(yǔ)音識(shí)別技術(shù)創(chuàng)新方面還有很長(zhǎng)的路要走。

研究的主要特點(diǎn)集中在如何使語(yǔ)音識(shí)別技術(shù)更加準(zhǔn)確。對(duì)于人類的語(yǔ)言理解,我們需要更多的準(zhǔn)確性。例如,一個(gè)人提出了一個(gè)問(wèn)題,“我如何改變相機(jī)的燈光設(shè)置?”這個(gè)問(wèn)題在技術(shù)上意味著個(gè)人想要調(diào)整相機(jī)的閃光燈。因此,在回答具體問(wèn)題之前,要先集中精力理解人類的自由語(yǔ)言。

因此,總的來(lái)說(shuō),機(jī)器學(xué)習(xí)和語(yǔ)音識(shí)別技術(shù)已經(jīng)進(jìn)入全球范圍,并開(kāi)始提供有效的運(yùn)用和高效的服務(wù)。很快,我們將會(huì)看到自動(dòng)速記員得到普遍提升,并在各大會(huì)議演講中扮演重要的角色。

原文標(biāo)題:Evolution of Speech Recognition Technology,作者:Sahil Chauhan

【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

 

責(zé)任編輯:龐桂玉 來(lái)源: 51CTO
相關(guān)推薦

2021-11-17 10:37:39

語(yǔ)音識(shí)別技術(shù)人工智能

2022-08-29 10:57:09

語(yǔ)音識(shí)蘋(píng)果頻率

2011-05-23 16:04:48

接入ADSLCable Modem

2022-09-08 12:29:37

掌靜脈識(shí)別應(yīng)用生物識(shí)別

2017-03-19 16:09:00

語(yǔ)音識(shí)別

2017-10-27 16:19:23

語(yǔ)音識(shí)別CNN

2022-12-01 07:03:22

語(yǔ)音識(shí)別人工智能技術(shù)

2021-04-14 14:49:47

語(yǔ)音識(shí)別技術(shù)人工智能

2024-03-11 11:32:38

語(yǔ)音識(shí)別

2013-11-22 09:43:21

SDN技術(shù)影響

2017-09-27 09:29:58

SDN技術(shù)應(yīng)用

2011-08-03 11:10:03

布線管理軟件綜合布線

2023-09-14 15:41:22

2024-03-12 09:08:36

可穿戴技術(shù)人工智能

2023-09-01 15:37:56

2022-03-30 09:00:00

物聯(lián)網(wǎng)行為互聯(lián)網(wǎng)設(shè)備

2009-08-21 15:28:23

C#英文

2022-07-06 13:21:52

語(yǔ)音識(shí)別

2023-02-28 12:12:21

語(yǔ)音識(shí)別技術(shù)解碼器

2012-10-29 11:33:01

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)