偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<u id="3p1hv"><rp id="3p1hv"><em id="3p1hv"></em></rp></u>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

人工智能語音技術(shù)的三大挑戰(zhàn)

作者：機(jī)房360 2022-12-05 09:42:21

為了讓語音對(duì)語音技術(shù)發(fā)揮其潛力，它必須支持各種口音、語言和方言，并且對(duì)每個(gè)人都可用——而不僅僅是特定的地區(qū)或市場。這需要掌握技術(shù)的特定應(yīng)用程序，并進(jìn)行大量的調(diào)優(yōu)和培訓(xùn)，以便有效地?cái)U(kuò)展。

人工智能從業(yè)者在談到語音對(duì)語音技術(shù)時(shí)通常會(huì)遇到常見的三個(gè)障礙。

人工智能(AI)能夠生成類似人類的數(shù)據(jù)的前景已經(jīng)被談?wù)摿藥资辍Ｈ欢?，?shù)據(jù)科學(xué)家已經(jīng)解決了這個(gè)問題，但收效甚微。精確確定創(chuàng)建此類系統(tǒng)的有效策略帶來了從技術(shù)到倫理以及兩者之間的各個(gè)方面的挑戰(zhàn)。然而，生成式人工智能已經(jīng)成為值得關(guān)注的亮點(diǎn)。

在最基本的情況下，生成式人工智能使機(jī)器能夠使用音頻文件、文本和圖像等元素生成從語音到寫作到藝術(shù)的內(nèi)容?？萍纪顿Y公司SequoiaCapita公司表示:“生成式人工智能不僅會(huì)變得更快、更便宜，在某些情況下還會(huì)比人類手工創(chuàng)造的人工智能更好?！?/p>

特別是基于生成語音的機(jī)器學(xué)習(xí)技術(shù)，最近的進(jìn)展已經(jīng)取得了巨大的進(jìn)步，但人們?nèi)匀挥泻荛L的路要走。事實(shí)上，語音壓縮出現(xiàn)在人們非常依賴的應(yīng)用程序中，比如Zoom和Teams，這仍然是基于上世紀(jì)80年代和90年代的技術(shù)。雖然語音對(duì)語音技術(shù)有無限的潛力，但評(píng)估生成式人工智能發(fā)展障礙的挑戰(zhàn)和缺點(diǎn)至關(guān)重要。

以下是人工智能從業(yè)者在談到語音對(duì)語音技術(shù)時(shí)常見的三個(gè)障礙。

1.音質(zhì)

可以說，最佳對(duì)話最重要的部分是它是可以理解的。在語音對(duì)語音技術(shù)的情況下，目標(biāo)是聽起來像人。例如，Siri和Alexa的機(jī)器人語調(diào)就像機(jī)器一樣，并不總是清晰。這很難通過人工智能實(shí)現(xiàn)，有幾個(gè)原因，但人類語言的細(xì)微差別起了很大作用。

梅拉比安法則可以幫助解釋這一點(diǎn)。人類的對(duì)話可以分為三部分：55%的面部表情，38%的語氣，以及僅僅7%的文字。機(jī)器理解依賴于文字或內(nèi)容來操作。只有在自然語言處理(NLP)方面取得了最近的進(jìn)展，才有可能根據(jù)情緒、情緒、音色和其他重要(但不一定是口語)的語言方面來訓(xùn)練AI模型。如果你只處理音頻，而不是視覺，這就更有挑戰(zhàn)性了，因?yàn)闆]有超過一半的理解來自面部表情。

2.延遲

人工智能綜合分析可能需要時(shí)間，但在語音對(duì)語音通信中，實(shí)時(shí)是唯一重要的時(shí)間。語音轉(zhuǎn)換必須在說話時(shí)立即發(fā)生。它還必須是準(zhǔn)確的，你可以想象，這對(duì)一臺(tái)機(jī)器來說不是一件容易的事。

實(shí)時(shí)的必要性因行業(yè)而異。例如，一個(gè)做播客的內(nèi)容創(chuàng)造者可能更關(guān)心音質(zhì)而不是實(shí)時(shí)語音轉(zhuǎn)換。但對(duì)于客戶服務(wù)這樣的行業(yè)，時(shí)間是至關(guān)重要的。如果呼叫中心代理使用語音輔助人工智能來響應(yīng)來電者，他們可能會(huì)在質(zhì)量上做出一些犧牲。盡管如此，時(shí)間對(duì)于提供積極的體驗(yàn)還是至關(guān)重要的。

3.規(guī)模

為了讓語音對(duì)語音技術(shù)發(fā)揮其潛力，它必須支持各種口音、語言和方言，并且對(duì)每個(gè)人都可用——而不僅僅是特定的地區(qū)或市場。這需要掌握技術(shù)的特定應(yīng)用程序，并進(jìn)行大量的調(diào)優(yōu)和培訓(xùn)，以便有效地?cái)U(kuò)展。

新興的技術(shù)解決方案并不是萬能的;對(duì)于給定的解決方案，所有用戶都需要通過數(shù)千個(gè)體系結(jié)構(gòu)來支持這種AI基礎(chǔ)設(shè)施。用戶還應(yīng)該期望對(duì)模型進(jìn)行一致的測試。這并不新鮮:機(jī)器學(xué)習(xí)的所有經(jīng)典挑戰(zhàn)也適用于生成式AI領(lǐng)域。

那么，人們?nèi)绾伍_始解決這些問題，從而開始意識(shí)到語音對(duì)語音技術(shù)的價(jià)值呢?幸運(yùn)的是，當(dāng)你逐步分解它時(shí)，它就不那么可怕了。首先，你必須掌握這個(gè)問題。前面我舉了一個(gè)呼叫中心和內(nèi)容創(chuàng)建者的例子。確保你考慮了用例和期望的結(jié)果，并從那里開始。

第二，確保您的組織擁有正確的體系結(jié)構(gòu)和算法。但在此之前，要確保企業(yè)有正確的數(shù)據(jù)。數(shù)據(jù)質(zhì)量很重要，特別是在考慮人類語言和語音這樣敏感的東西時(shí)。最后，如果您的應(yīng)用程序需要實(shí)時(shí)語音轉(zhuǎn)換，請(qǐng)確保該功能得到支持。最終，沒人想和機(jī)器人說話。

雖然關(guān)于生成人工智能深度造假、同意和適當(dāng)披露的倫理擔(dān)憂現(xiàn)在逐漸浮出水面，但重要的是首先要理解和解決基本問題。語音對(duì)語音技術(shù)有可能徹底改變我們理解彼此的方式，為將人們團(tuán)結(jié)起來的創(chuàng)新創(chuàng)造機(jī)會(huì)。但為了實(shí)現(xiàn)這一目標(biāo)，必須首先面對(duì)主要挑戰(zhàn)。?

責(zé)任編輯：武曉燕來源： Harris編譯

語音人工智能程序

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<wbr id="8v10y"><sup id="8v10y"></sup></wbr>

<rt id="8v10y"></rt>