中英實(shí)時(shí)語音翻譯 Skype Translator中文預(yù)覽版登陸中國(guó)
今天,我們正式宣布在中國(guó)市場(chǎng)推出Skype Translator實(shí)時(shí)語音翻譯技術(shù)的中文預(yù)覽版。自此,英文和中文普通話之間的實(shí)時(shí)語音對(duì)話將成為現(xiàn)實(shí)。Skype Translator不僅凝聚了微軟在語音識(shí)別、自動(dòng)翻譯和機(jī)器學(xué)習(xí)等科技領(lǐng)域幾十年的研究成果,更深刻地體現(xiàn)了微軟“用戶體驗(yàn)至上”的理念。自2014年12月Skype Translator 推出英文和西班牙文之間的實(shí)時(shí)語音翻譯之后,此次在中國(guó)市場(chǎng)的發(fā)布是Skype Translator旅程中又一個(gè)令人無比興奮的里程碑,Windows 8.1用戶在Skype Translator注冊(cè)頁面 完成中文版的注冊(cè)后,就可以立即試用了。
眾所周知,中文的美麗***,同時(shí)它也是一門***挑戰(zhàn)性的語言,甚至對(duì)于Skype Translator來說也是如此。中文有大約一萬個(gè)常用漢字以及多種多樣的語音、語調(diào),這對(duì)于母語為英語的學(xué)習(xí)者來說是***的困難之一,有類似困難的語言還有阿拉伯語、日語和韓語。
微軟作為語音翻譯領(lǐng)域的先驅(qū)者,在2012年***演示了英文和中文普通話之間的實(shí)時(shí)語音翻譯技術(shù)原型。微軟在北京的研究團(tuán)隊(duì)與位于美國(guó)雷蒙德的同事們密切合作,經(jīng)過多年的辛勤研究和專注投入,完成了普通話的語言模型,使Skype Translator的中文語音翻譯在今天變?yōu)楝F(xiàn)實(shí)。
不僅如此,近段時(shí)間,得益于深層神經(jīng)網(wǎng)絡(luò)與微軟成熟的統(tǒng)計(jì)機(jī)器翻譯技術(shù)的結(jié)合,語音識(shí)別能力被進(jìn)一步提高,隨之得到的更準(zhǔn)確的翻譯結(jié)果讓一對(duì)一的語音交談成為現(xiàn)實(shí)。Skype一直致力于幫助人們進(jìn)行無障礙的溝通,而Skype Translator就是達(dá)到這一目標(biāo)的***科技產(chǎn)物。
Skype Translator預(yù)覽版適用于Windows 8.1或Windows 10技術(shù)預(yù)覽版的客戶端或平板電腦客戶端。除了英文和中文普通話的語音翻譯之外,還支持四十多種語言的即時(shí)文本翻譯。預(yù)覽階段對(duì)Skype Translator的開發(fā)與優(yōu)化極其重要,因?yàn)橛脩粼谑褂卯a(chǎn)品的同時(shí)所提供的有價(jià)值的反饋,可幫助我們進(jìn)行產(chǎn)品優(yōu)化,不斷幫助該技術(shù)進(jìn)行智能化的提升, 支持更多種語言的應(yīng)用。
Skype Translator如何運(yùn)作
機(jī)器學(xué)習(xí)是指軟件學(xué)習(xí)訓(xùn)練數(shù)據(jù)的能力。Skype Translator構(gòu)建于強(qiáng)大的機(jī)器學(xué)習(xí)平臺(tái)之上。通過在預(yù)覽版階段獲取的訓(xùn)練數(shù)據(jù),加之其中的細(xì)微差別,軟件就能夠針對(duì)真實(shí)使用者的不同話題、口音與語言轉(zhuǎn)換進(jìn)行學(xué)習(xí),實(shí)現(xiàn)更好的識(shí)別和翻譯。
Skype Translator的機(jī)器學(xué)習(xí)協(xié)議訓(xùn)練并優(yōu)化語音識(shí)別和機(jī)器翻譯任務(wù),就像黏住這些元素的膠水一樣,該協(xié)議促進(jìn)對(duì)被識(shí)別的文本進(jìn)行更好的翻譯。這個(gè)過程包括去除造成不流利的字詞(例如“啊”“嗯”以及重復(fù)措辭)、將文本分解成句子、添加標(biāo)點(diǎn)符號(hào)和大小寫識(shí)別。
語音識(shí)別和機(jī)器翻譯的訓(xùn)練數(shù)據(jù)來源多種多樣,包括翻譯的網(wǎng)頁、配有字幕的視頻,以及預(yù)先翻譯且轉(zhuǎn)錄成文字的一對(duì)一談話。Skype Translator通過記錄這些對(duì)話來分析對(duì)話文本并訓(xùn)練系統(tǒng)更好地“學(xué)習(xí)”各種語言。已經(jīng)有很多人與我們分享了他們過去的對(duì)話記錄,我們對(duì)其進(jìn)行了分析并為統(tǒng)計(jì)模型創(chuàng)造訓(xùn)練數(shù)據(jù),該統(tǒng)計(jì)模型教會(huì)語音識(shí)別和機(jī)器翻譯引擎如何將收集到的語音轉(zhuǎn)換為文本信息,然后將文本信息轉(zhuǎn)換為另一種語言。使用Skype Translator的用戶都會(huì)在對(duì)話開始前得到清晰的系統(tǒng)提示,即對(duì)話將被錄制并用于提高微軟翻譯和語音識(shí)別服務(wù)的質(zhì)量。
在準(zhǔn)備好的數(shù)據(jù)被錄入機(jī)器學(xué)習(xí)系統(tǒng)后,機(jī)器學(xué)習(xí)軟件會(huì)在這些對(duì)話和環(huán)境涉及到的單詞中搭建一個(gè)統(tǒng)計(jì)模型。當(dāng)用戶說話時(shí),軟件會(huì)在該統(tǒng)計(jì)模型中尋找相似的內(nèi)容,之后應(yīng)用到預(yù)先“學(xué)到”的轉(zhuǎn)化程序中,使得音頻轉(zhuǎn)換為文本再?gòu)奈谋巨D(zhuǎn)換成另一種語言。
雖然語音識(shí)別一直是近幾十年來的重要研究課題,但是該技術(shù)的發(fā)展普遍被錯(cuò)誤率高、麥克風(fēng)敏感度差異、噪音環(huán)境等因素阻礙。微軟研究院率先將深層神經(jīng)網(wǎng)絡(luò)(DNNs)技術(shù)引入語音識(shí)別,極大程度地降低了錯(cuò)誤率,提高了可靠性,最終使這項(xiàng)語音翻譯技術(shù)得以更廣泛地應(yīng)用,包括Skype Translator。
Skype Translator的機(jī)器翻譯部分負(fù)責(zé)將文本從一種語言翻譯成另一種語言。它采用了和必應(yīng)在線翻譯同樣的技術(shù):開創(chuàng)性地結(jié)合了句法和統(tǒng)計(jì)模型,此外更加有針對(duì)性地訓(xùn)練對(duì)話性語言。這點(diǎn)非常有挑戰(zhàn)性,因?yàn)楝F(xiàn)在用來搭建文本翻譯系統(tǒng)的典型訓(xùn)練數(shù)據(jù)都是優(yōu)化過的清晰、結(jié)構(gòu)嚴(yán)謹(jǐn)?shù)臅嬲Z言。我們的系統(tǒng)在包含必應(yīng)翻譯的豐富語言知識(shí)的同時(shí),還額外加入了口語對(duì)話中出現(xiàn)的單詞及短語。
另外,我們創(chuàng)造了一個(gè)定制化的機(jī)器人程式來協(xié)調(diào)整個(gè)產(chǎn)品體驗(yàn)。如電話中的第三方一樣,它負(fù)責(zé)建立電話連接、發(fā)送音頻流至語音引擎獲取翻譯文本,并分別在雙方結(jié)束說話時(shí)翻譯其所說的內(nèi)容。
要?jiǎng)?chuàng)造這樣的程式,需要微軟研究院和Skype團(tuán)隊(duì)集合雙方共同的專業(yè)知識(shí)和工程能力,形成一個(gè)復(fù)雜的架構(gòu),但希望對(duì)用戶來說獲取的則是簡(jiǎn)單而直接的體驗(yàn)。
克服挑戰(zhàn)
語言像是一只野獸,它時(shí)刻變化著,口音和語種層出不窮,書面語言和口語表達(dá)又有著非常大的區(qū)別。為提供***的體驗(yàn),我們不得不克服各種語言挑戰(zhàn)。
人類終究不是神,人類會(huì)犯錯(cuò)誤,會(huì)思考,會(huì)改變想法。這些思考過程在口語中則表現(xiàn)為不流利的溝通。就像之前提到的,人們?cè)谡f話時(shí)會(huì)停頓、重復(fù),并且會(huì)有例如“嗯”“啊”之類的語氣詞。理想情況下,這些細(xì)微之處都不應(yīng)該出現(xiàn)在翻譯和翻譯文本中,但我們的機(jī)器學(xué)習(xí)模型針對(duì)以上問題會(huì)相應(yīng)處理這些停頓。在預(yù)覽版中您會(huì)看到部分語氣詞停頓被移除,而對(duì)于其他沒有被移除的部分,我們希望通過用戶的反饋進(jìn)行優(yōu)化。
人類的獨(dú)特之處在于,我們溝通時(shí)的口語和俚語會(huì)相應(yīng)地體現(xiàn)出我們所在的地區(qū)、國(guó)家以及文化特征?;诙嗄暝诟魃缃幻襟w網(wǎng)站的實(shí)踐,Microsoft Translator已經(jīng)在俚語翻譯方面擁有了不錯(cuò)的表現(xiàn)。這也幫助Skype Translator進(jìn)一步提高了日常短語和術(shù)語的翻譯能力。Skype Translator預(yù)覽版會(huì)幫助系統(tǒng)觀察和學(xué)習(xí)更多的日常對(duì)話,從而將真實(shí)的對(duì)話語言更加準(zhǔn)確的翻譯出來。
另外,在語言翻譯的用戶體驗(yàn)中也存在一些固有的挑戰(zhàn)。比如,Skype Translator的自動(dòng)翻譯器會(huì)以類似于第三方通話者的角色出現(xiàn)。我們發(fā)現(xiàn),過去使用過現(xiàn)場(chǎng)翻譯服務(wù)的用戶能很快適應(yīng)這種溝通方式,而其他用戶則需要更多的時(shí)間來適應(yīng)。
雖然此次預(yù)覽版的發(fā)布對(duì)于參與開發(fā)的團(tuán)隊(duì)來說是一個(gè)重大的突破,但這只是我們?cè)趧?chuàng)造***翻譯體驗(yàn)之路上邁出的一步。我們將在預(yù)覽版用戶提供的反饋和數(shù)據(jù)基礎(chǔ)上提升技術(shù)并優(yōu)化Skype Translator所創(chuàng)造的獨(dú)特體驗(yàn)。雖然我們打下了穩(wěn)固的基礎(chǔ),但對(duì)此項(xiàng)技術(shù)來說,這只是起步,在某些方面我們的工作才剛剛開始。
相較于2014年12 月推出的英文和西班牙文之間的實(shí)時(shí)語音對(duì)話,本次推出中文預(yù)覽版的功能更新如下:
• 語音讀取文字信息
用戶可以通過語音收聽到對(duì)話方發(fā)送給自己的即時(shí)消息,語音的語言可以自選。
• 持續(xù)性識(shí)別
在對(duì)方發(fā)送語音信息期間可持續(xù)性的進(jìn)行文字翻譯。
• 自動(dòng)聲量控制
您的對(duì)話方可以在實(shí)時(shí)語音翻譯期間不間斷地說話。同時(shí),您可收聽到較高音量的語音翻譯,對(duì)話方本身的語音信息呈現(xiàn)出較低音量,所以您只要將注意力集中在語音翻譯上即可,這可以保證翻譯信息的收聽流暢。
• 語言翻譯靜音功能
您可以任意開啟或關(guān)閉語音翻譯的聲音,并直接讀取文字翻譯。
除了語音翻譯現(xiàn)有的四種語言(英語,西班牙語,中文普通話,意大利語), Skype Translator 的即時(shí)通訊文本翻譯更是在原有40多種語言的基礎(chǔ)上加入了塞爾維亞語,波斯尼亞語,克羅地亞語,瑪雅語和奧托米語。
今天,我們將見證Skype Translator的另一個(gè)新篇章,世界各地的人們與親朋好友溝通交流的方式變得更加豐富。我們的愿景,是在盡可能多的平臺(tái)實(shí)現(xiàn)盡可能多的語種翻譯,為全球3億多的Skype用戶在各個(gè)相關(guān)平臺(tái)提供***體驗(yàn)。我們將繼續(xù)研發(fā)這項(xiàng)技術(shù),期待與您在未來一同分享更多的里程碑。謝謝您的一路同行!
現(xiàn)在開始,中英實(shí)時(shí)語音翻譯的大幕已經(jīng)拉開?,F(xiàn)在通過Skype Translator預(yù)覽版網(wǎng)頁注冊(cè),開啟您的體驗(yàn)之旅吧。