偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

語(yǔ)音實(shí)時(shí)變文字 「搜狗聽寫」解決記者作家文字整理難題

企業(yè)動(dòng)態(tài)

[[199729]]

 AI的“黃金時(shí)代”已來(lái)!那離我們最近的AI是什么呢?地圖里的語(yǔ)音入口,機(jī)器翻譯、拍照識(shí)圖、無(wú)人超市,還是最近大熱的智能音箱,比如正式開售的可語(yǔ)音購(gòu)物的xx精靈。但這些真是能解決痛點(diǎn)的AI嗎?

近日,在AI領(lǐng)域贏得先機(jī)并明確將赴美上市的搜狗,推出了一款小眾的免費(fèi)產(chǎn)品——“搜狗聽寫”,目的是為了解決會(huì)議、采訪、寫作等場(chǎng)景下長(zhǎng)語(yǔ)音內(nèi)容轉(zhuǎn)寫難,可以將語(yǔ)音實(shí)時(shí)轉(zhuǎn)變成文字,并能標(biāo)注重點(diǎn)、邊寫邊改進(jìn)行文字編輯。

“聽寫”和“轉(zhuǎn)寫”為文字工作者減負(fù)

采訪一小時(shí),整理錄音三小時(shí),寫稿兩小時(shí)……這是機(jī)器人圈記者的工作常態(tài),相信也是大量同行的日常,而且除了記者編輯,包括職業(yè)寫作者、會(huì)議記錄整理者在內(nèi)的不少文字工作從業(yè)人員都有相似遭遇。

當(dāng)然,“人肉”速記能夠解決部分難題,但一有專業(yè)性的門檻,有些速記記錄的術(shù)語(yǔ)實(shí)在不忍多看;二是時(shí)間上需要排期,費(fèi)用上也需要考慮,并不是所有的“扒速記”工作都能如愿“轉(zhuǎn)包”出去。當(dāng)然,市面上也有類似的工具,提供付費(fèi)的轉(zhuǎn)寫服務(wù),只是準(zhǔn)確率仍差強(qiáng)人意。

再看“搜狗聽見”這款免費(fèi)的APP,確實(shí)是擊中了部分人的需求。從功能上看,提供包括“聽寫”和“轉(zhuǎn)寫”在內(nèi)的兩種模式:“聽寫”模式可在錄音的同時(shí)給出實(shí)時(shí)識(shí)別結(jié)果;“轉(zhuǎn)寫”模式則可在離線狀態(tài)下錄音,錄音完成后一次性獲取文字結(jié)果。

它還提供邊聽邊改(保存錄音后,可以邊聽錄音邊修改文字)、根據(jù)語(yǔ)義自動(dòng)添加標(biāo)點(diǎn)、支持文本/語(yǔ)音標(biāo)重點(diǎn)、多客戶端同步、信息分享等功能,并且在人的說(shuō)話音量低至30分貝時(shí),依然可以識(shí)別。

值得一提的是它的“大殺器”功能,可以根據(jù)記者、作家、自媒體等文字工作者的需要,連接搜狗輸入法的個(gè)人詞庫(kù),引入個(gè)性化詞匯,比如機(jī)器人圈的昵稱“圈圈”估計(jì)就屬于獨(dú)門。

此外,“搜狗聽寫”還將推出Windows版,專注大會(huì)場(chǎng)景的實(shí)時(shí)速記。

“喂”數(shù)據(jù)才能更強(qiáng)大

對(duì)于有著強(qiáng)大需求的機(jī)器人圈記者,在現(xiàn)場(chǎng)已經(jīng)迫不及待的試用了一下產(chǎn)品。

記事寫作比訪談錄音呈現(xiàn)出來(lái)的準(zhǔn)確性更高

對(duì)此,機(jī)器人圈記者也采訪了搜狗公司語(yǔ)音交互技術(shù)中心總經(jīng)理王硯峰,他表示所有的搜狗語(yǔ)音類產(chǎn)品背后都是知音引擎,不過(guò),一般面向具體的場(chǎng)景會(huì)有優(yōu)化,有專門的語(yǔ)音模型。在演講、聊天的場(chǎng)景下,和車載、會(huì)議以及手機(jī)近場(chǎng)說(shuō)話的語(yǔ)音模型都是不盡相同的。

搜狗語(yǔ)音交互技術(shù)中心技術(shù)總監(jiān)陳偉還介紹,搜狗聽寫使用了搜狗知音引擎的長(zhǎng)時(shí)語(yǔ)音轉(zhuǎn)寫技術(shù),從立項(xiàng)到現(xiàn)在,錯(cuò)誤率已經(jīng)下降30%。在聲學(xué)模型方面,采用了端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)Deep LC-CLDNN+CTC技術(shù),轉(zhuǎn)寫模式則使用了Deep CNN+CTC的方式,語(yǔ)言模型基于T級(jí)海量輸入法文本數(shù)據(jù)使用神經(jīng)網(wǎng)絡(luò)進(jìn)行建模。

此外,影響準(zhǔn)確度的還有硬件降噪,手機(jī)的降噪能力是比較弱的,尤其手機(jī)上在遠(yuǎn)場(chǎng)的識(shí)別率不高,原因就在硬件上手機(jī)并沒有面向遠(yuǎn)場(chǎng)識(shí)別的麥克風(fēng)陣列。

還有一個(gè)重要的原因是數(shù)據(jù)的不足,“喂”數(shù)據(jù)訓(xùn)練模型提高準(zhǔn)確度已經(jīng)是產(chǎn)業(yè)界公開的秘密,實(shí)時(shí)語(yǔ)料數(shù)據(jù)也將成為這一領(lǐng)域的真正“壁壘”,所以希望準(zhǔn)確度提高,也離不開每個(gè)用戶的支持。

“自然交互+知識(shí)計(jì)算”的技術(shù)路線圖

當(dāng)語(yǔ)音領(lǐng)域的隊(duì)友們都在“刷音箱”,為什么搜狗卻做了一款“小眾”的轉(zhuǎn)寫APP呢?稍微回顧一下,搜狗在語(yǔ)言領(lǐng)域的布局。在2016年6月的搜狗輸入法十周年上,搜狗CEO王小川就提出了將人工智能定位搜狗輸入法的下一階段戰(zhàn)略發(fā)展的新方向,搜狗CTO楊洪濤則***透露了搜狗輸入法的快速分享、聰明回復(fù)和妙筆修飾等目前正在研發(fā)的三個(gè)能夠增強(qiáng)用戶表達(dá)能力的人工智能新技術(shù);而在7月的奇點(diǎn)創(chuàng)新者峰會(huì)上,王小川更是直接邀請(qǐng)一名現(xiàn)場(chǎng)觀眾上臺(tái)直接演示完全通過(guò)自然語(yǔ)音來(lái)發(fā)送一段短信息。

2016年8,搜狗知音引擎發(fā)布,正式確立自然交互+知識(shí)計(jì)算的重點(diǎn),將智能語(yǔ)音視為入口,并與場(chǎng)景相結(jié)合。當(dāng)互聯(lián)網(wǎng)公司和提供AI技術(shù)服務(wù)的公司進(jìn)入了同一賽道,他們的“占位”方式還是略有差異。

在不久前,搜狗CEO王小川在給員工的內(nèi)部信件中寫到:搜狗是為語(yǔ)言理解而生的,除了搜索引擎對(duì)語(yǔ)言理解有無(wú)盡的追求,搜狗更有市場(chǎng)份額絕對(duì)領(lǐng)先的輸入法產(chǎn)品,也專注在自然語(yǔ)言的計(jì)算與處理。正因?yàn)橛休斎敕ê退阉?,搜狗天然具備了啃這塊骨頭的能力。搜狗將基于對(duì)自然語(yǔ)言的交互和計(jì)算,將搜索升級(jí)到問(wèn)答系統(tǒng),將輸入法升級(jí)到對(duì)話系統(tǒng),并通過(guò)翻譯將中文世界與全世界連接。

其實(shí)更通俗的理解是,作為一家?guī)в蠥I基因的互聯(lián)網(wǎng)公司,搜狗并不認(rèn)為技術(shù)是能直接變現(xiàn)的,用戶積累、硬件落地才是更合理的方式。如果說(shuō),“搜狗聽寫”是一個(gè)小創(chuàng)新的話,我們期待在人工智能領(lǐng)域重大的創(chuàng)新早日到來(lái)。

責(zé)任編輯:Jane 來(lái)源: 未知
相關(guān)推薦

2019-08-29 08:38:14

搜狗錄音筆AI

2017-09-06 10:51:22

Facebook

2015-03-26 14:06:30

搜狗手機(jī)輸入法顏文字

2019-06-24 09:30:00

開源技術(shù) 趨勢(shì)

2013-04-12 10:05:49

HTML5WebSocket

2022-02-05 08:20:25

DeepSpeech開源軟件開發(fā)

2019-12-13 09:48:48

開源技術(shù) 軟件

2012-07-27 15:45:28

Mountain LiMacOS

2022-11-06 16:29:34

2024-11-29 07:45:38

C#離線語(yǔ)音文字

2022-01-23 08:26:57

微信暫停語(yǔ)音朗讀文字

2014-12-30 09:35:16

文字轉(zhuǎn)語(yǔ)音

2022-11-06 09:55:59

2021-01-08 10:00:53

鴻蒙訊飛平臺(tái)語(yǔ)音控制

2018-03-07 22:16:31

游戲語(yǔ)音

2017-12-22 21:42:24

游戲語(yǔ)音游戲?qū)崟r(shí)語(yǔ)音

2010-08-24 13:25:16

DIV+CSS

2010-09-14 10:34:17

DIV CSS

2023-12-18 15:00:00

模型數(shù)據(jù)

2014-11-13 11:19:55

語(yǔ)音輸入搜狗語(yǔ)音
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)