偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

人工智能語音技術(shù)的三大挑戰(zhàn)

人工智能
為了讓語音對語音技術(shù)發(fā)揮其潛力,它必須支持各種口音、語言和方言,并且對每個人都可用——而不僅僅是特定的地區(qū)或市場。這需要掌握技術(shù)的特定應(yīng)用程序,并進(jìn)行大量的調(diào)優(yōu)和培訓(xùn),以便有效地擴展。

人工智能從業(yè)者在談到語音對語音技術(shù)時通常會遇到常見的三個障礙。

人工智能(AI)能夠生成類似人類的數(shù)據(jù)的前景已經(jīng)被談?wù)摿藥资辍H欢?,?shù)據(jù)科學(xué)家已經(jīng)解決了這個問題,但收效甚微。精確確定創(chuàng)建此類系統(tǒng)的有效策略帶來了從技術(shù)到倫理以及兩者之間的各個方面的挑戰(zhàn)。然而,生成式人工智能已經(jīng)成為值得關(guān)注的亮點。

在最基本的情況下,生成式人工智能使機器能夠使用音頻文件、文本和圖像等元素生成從語音到寫作到藝術(shù)的內(nèi)容??萍纪顿Y公司SequoiaCapita公司表示:“生成式人工智能不僅會變得更快、更便宜,在某些情況下還會比人類手工創(chuàng)造的人工智能更好。”

特別是基于生成語音的機器學(xué)習(xí)技術(shù),最近的進(jìn)展已經(jīng)取得了巨大的進(jìn)步,但人們?nèi)匀挥泻荛L的路要走。事實上,語音壓縮出現(xiàn)在人們非常依賴的應(yīng)用程序中,比如Zoom和Teams,這仍然是基于上世紀(jì)80年代和90年代的技術(shù)。雖然語音對語音技術(shù)有無限的潛力,但評估生成式人工智能發(fā)展障礙的挑戰(zhàn)和缺點至關(guān)重要。

以下是人工智能從業(yè)者在談到語音對語音技術(shù)時常見的三個障礙。

1.音質(zhì)

可以說,最佳對話最重要的部分是它是可以理解的。在語音對語音技術(shù)的情況下,目標(biāo)是聽起來像人。例如,Siri和Alexa的機器人語調(diào)就像機器一樣,并不總是清晰。這很難通過人工智能實現(xiàn),有幾個原因,但人類語言的細(xì)微差別起了很大作用。

梅拉比安法則可以幫助解釋這一點。人類的對話可以分為三部分:55%的面部表情,38%的語氣,以及僅僅7%的文字。機器理解依賴于文字或內(nèi)容來操作。只有在自然語言處理(NLP)方面取得了最近的進(jìn)展,才有可能根據(jù)情緒、情緒、音色和其他重要(但不一定是口語)的語言方面來訓(xùn)練AI模型。如果你只處理音頻,而不是視覺,這就更有挑戰(zhàn)性了,因為沒有超過一半的理解來自面部表情。

2.延遲

人工智能綜合分析可能需要時間,但在語音對語音通信中,實時是唯一重要的時間。語音轉(zhuǎn)換必須在說話時立即發(fā)生。它還必須是準(zhǔn)確的,你可以想象,這對一臺機器來說不是一件容易的事。

實時的必要性因行業(yè)而異。例如,一個做播客的內(nèi)容創(chuàng)造者可能更關(guān)心音質(zhì)而不是實時語音轉(zhuǎn)換。但對于客戶服務(wù)這樣的行業(yè),時間是至關(guān)重要的。如果呼叫中心代理使用語音輔助人工智能來響應(yīng)來電者,他們可能會在質(zhì)量上做出一些犧牲。盡管如此,時間對于提供積極的體驗還是至關(guān)重要的。

3.規(guī)模

為了讓語音對語音技術(shù)發(fā)揮其潛力,它必須支持各種口音、語言和方言,并且對每個人都可用——而不僅僅是特定的地區(qū)或市場。這需要掌握技術(shù)的特定應(yīng)用程序,并進(jìn)行大量的調(diào)優(yōu)和培訓(xùn),以便有效地擴展。

新興的技術(shù)解決方案并不是萬能的;對于給定的解決方案,所有用戶都需要通過數(shù)千個體系結(jié)構(gòu)來支持這種AI基礎(chǔ)設(shè)施。用戶還應(yīng)該期望對模型進(jìn)行一致的測試。這并不新鮮:機器學(xué)習(xí)的所有經(jīng)典挑戰(zhàn)也適用于生成式AI領(lǐng)域。

那么,人們?nèi)绾伍_始解決這些問題,從而開始意識到語音對語音技術(shù)的價值呢?幸運的是,當(dāng)你逐步分解它時,它就不那么可怕了。首先,你必須掌握這個問題。前面我舉了一個呼叫中心和內(nèi)容創(chuàng)建者的例子。確保你考慮了用例和期望的結(jié)果,并從那里開始。

第二,確保您的組織擁有正確的體系結(jié)構(gòu)和算法。但在此之前,要確保企業(yè)有正確的數(shù)據(jù)。數(shù)據(jù)質(zhì)量很重要,特別是在考慮人類語言和語音這樣敏感的東西時。最后,如果您的應(yīng)用程序需要實時語音轉(zhuǎn)換,請確保該功能得到支持。最終,沒人想和機器人說話。

雖然關(guān)于生成人工智能深度造假、同意和適當(dāng)披露的倫理擔(dān)憂現(xiàn)在逐漸浮出水面,但重要的是首先要理解和解決基本問題。語音對語音技術(shù)有可能徹底改變我們理解彼此的方式,為將人們團(tuán)結(jié)起來的創(chuàng)新創(chuàng)造機會。但為了實現(xiàn)這一目標(biāo),必須首先面對主要挑戰(zhàn)。?

責(zé)任編輯:武曉燕 來源: Harris編譯
相關(guān)推薦

2022-12-01 07:03:22

語音識別人工智能技術(shù)

2022-07-29 11:52:12

人工智能智能設(shè)備硬件

2022-12-05 07:17:14

人工智能語音合成

2022-12-15 07:35:04

人工智能語音應(yīng)用場景

2021-09-27 10:37:36

人工智能AI深度學(xué)習(xí)

2018-07-31 22:06:15

2020-12-15 15:01:48

人工智能機器學(xué)習(xí)深度學(xué)習(xí)

2017-04-24 18:39:24

人工智能

2022-03-10 16:27:54

人工智能企業(yè)高管職業(yè)發(fā)展

2019-09-05 19:33:59

5G人工智能區(qū)塊鏈

2024-08-01 08:00:00

人工智能安全

2020-06-01 08:34:41

人工智能AI工業(yè)應(yīng)用

2017-03-20 11:00:48

語音識別搜索框人工智能

2023-09-28 12:52:58

2020-06-22 13:56:41

人工智能醫(yī)療AI

2022-06-23 12:37:37

人工智能物聯(lián)網(wǎng)邊緣計算

2024-02-02 09:50:59

2020-01-03 08:00:00

人工智能AI

2022-11-09 10:39:27

2022-11-14 15:06:16

點贊
收藏

51CTO技術(shù)棧公眾號