為何Siri得從測(cè)試版開(kāi)始
近些天來(lái)抨擊Siri似乎已成了潮流。Mat Honan以“Apple’s broken promise”一文極盡嘲諷,CNN報(bào)道了Siri所謂的反墮胎偏見(jiàn),John Gruber評(píng)論說(shuō)蘋果的旗艦極新產(chǎn)品“在小處如此粗糙”,實(shí)在是不可思議,但他也同時(shí)指出:被廣泛使用以后,語(yǔ)音識(shí)別更容易提高。
這不僅是更容易,而且是只能這樣!
我在IBM Research的語(yǔ)音識(shí)別項(xiàng)目里工作了近六年。我們參加了由DARPA(美國(guó)國(guó)防部高級(jí)研究計(jì)劃局)贊助的研究項(xiàng)目、實(shí)地測(cè)試、以及各種應(yīng)用的實(shí)際產(chǎn)品開(kāi)發(fā):聽(tīng)寫、呼叫中心、汽車、甚至是聽(tīng)障人員的課堂助理。盡管具體項(xiàng)目不一,但基本的東西從來(lái)不變:給我們更多的數(shù)據(jù)!(數(shù)據(jù)在這里指語(yǔ)音錄音)一些研究員還認(rèn)為最近語(yǔ)音識(shí)別準(zhǔn)確性的提高要?dú)w功于更多的更好的數(shù)據(jù),而不是更好的算法。
記錄下來(lái)的語(yǔ)音錄音被用來(lái)訓(xùn)練聲學(xué)模型(聲音波形和音位如何關(guān)聯(lián))、發(fā)音詞匯(在說(shuō)單詞,特別是人名和地名時(shí),人們是如何發(fā)音錯(cuò)誤的)、語(yǔ)言模型(口語(yǔ)短語(yǔ)很少符和英語(yǔ)語(yǔ)法)、以及自然語(yǔ)言處理器。每個(gè)支持的語(yǔ)言都要這樣做!更多的訓(xùn)練數(shù)據(jù)意味著識(shí)別器能處理更多在語(yǔ)音、口音、語(yǔ)言風(fēng)格等方面的變化。
把Siri看作是某種人工智能,要是訓(xùn)練有素,她就可能回答出各種各樣的問(wèn)題——這很誘人。而現(xiàn)實(shí)情況是,她是一個(gè)非常復(fù)雜的各種子系統(tǒng)的混合體,其中有許多還需要手工操作。要改進(jìn)Siri,工程師就得不辭辛勞地查看她所有不明白的請(qǐng)求(所有語(yǔ)言!),再制定新的規(guī)則來(lái)處理它們。像目前類似“墮胎診所”這樣漏洞可能還有很多很多,而這些都會(huì)慢慢被修補(bǔ)。當(dāng)蘋果說(shuō)“我們找到可改進(jìn)的地方后,就會(huì)來(lái)接下來(lái)的幾星期……”,他們已經(jīng)明白地描述了這個(gè)過(guò)程是如何操作的。
重要的是要明白,在公開(kāi)發(fā)布前,Siri無(wú)法像蘋果的硬件和應(yīng)用設(shè)計(jì)那樣,在實(shí)驗(yàn)室里進(jìn)行各種微調(diào)和全面測(cè)試,她必須要以現(xiàn)在的形態(tài)推向市場(chǎng),盡可能接觸到從音質(zhì)到自然語(yǔ)言的解讀的盡可能多的變化。蘋果工程師已預(yù)測(cè)到了不少搞笑的問(wèn)題,而可憐的Siri還得接著忍受那些沒(méi)被預(yù)測(cè)到的。
假如真如傳言那樣,Apple TV會(huì)用上語(yǔ)音操控功能,那么Siri很快會(huì)有其它挑戰(zhàn)。比如,遠(yuǎn)處的語(yǔ)音識(shí)別比起近距離地使用麥克風(fēng)要困難許多。
出自:36氪
【編輯推薦】