一邊深耕場景化應(yīng)用一邊構(gòu)建DUI生態(tài),AI生態(tài)這盤棋思必馳要怎么下
3月20日,思必馳在2018中國人工智能應(yīng)用與生態(tài)峰會上榮獲中國領(lǐng)先語音智能廠商的殊榮后,中國軟件網(wǎng)獨家專訪到了思必馳CMO龍夢竹,就智能語音的發(fā)展、思必馳的應(yīng)對策略以及備受關(guān)注的DUI開放平臺等內(nèi)容展開了對話。
語音是IOT時代的人機(jī)交互方式,發(fā)展?jié)摿薮?/p>
火爆的人工智能市場中,機(jī)器視覺和智能語音一直是最受關(guān)注的發(fā)展方向之一。機(jī)器視覺的廠商無論從融資額還是市場估值普遍都高于智能語音廠商。最直接的原因就是機(jī)器視覺已經(jīng)找到了相對成熟的商業(yè)落地模式,在安防、醫(yī)療等領(lǐng)域能更為明顯而直接的帶來效率的提升。
語音與視覺不同,語音是富信息,語音交互中帶有音色、音量、速度、節(jié)奏等信息,不同的語境與語調(diào)會帶來***的可能。人類經(jīng)歷著從PC互聯(lián)時代、移動互聯(lián)網(wǎng)時代到現(xiàn)在IoT時代的發(fā)展,交互方式也從傳統(tǒng)的按鍵、觸摸等交互方式向語音交互方向發(fā)展。產(chǎn)業(yè)鏈正在迎來變革,AI及AI+的專業(yè)分化進(jìn)程加速。龍夢竹表示,語音交互成為IoT時代最重要的交互方式之一,將會迎來更廣闊的發(fā)展前景。
由于語言本身的多樣性,智能語音技術(shù)難度和壁壘較高
隨著阿里天貓精靈、聯(lián)想智能音箱、小米互聯(lián)網(wǎng)音箱的火爆,在背后提供語音交互技術(shù)支持的思必馳也逐漸在公眾面前露出。不知從何時起,“人工智障”這個詞成為了大家戲謔和調(diào)侃的口頭禪。談到語音交互的現(xiàn)狀,與大家將“人工智障”歸結(jié)于技術(shù)問題的認(rèn)知不同,龍夢竹認(rèn)為目前語音智能的技術(shù)水平已經(jīng)比較成熟,但也存在幾個方面的問題與瓶頸有待突破,其中語音交互場景中不確定因素多、單點智能到整體智能路徑的瓶頸、性價比和內(nèi)容知識圖譜建立不完善等問題,都對語音交互體驗有所影響。
首先,語言本身包含的內(nèi)容非常豐富。比如:“嘿,等著我”既可能是夕陽下少男少女口中的呢喃,也可能是打架斗毆后撂下的狠話。另一方面,大家對語音交互的測試挑戰(zhàn)早已超出了正常對話狀況,畢竟沒有人在對話的時候突然冒出一句“**放個屁”“***,天王蓋地虎”,但這種挑戰(zhàn)人工智能的對話,對智能硬件來說早已習(xí)以為常了。其次,人們已經(jīng)習(xí)慣了在場景下的不同反應(yīng),但對于人工智能而言,交互是一個全鏈路的過程,不僅僅是語音識別,還有語義理解、語音合成等一系列環(huán)節(jié),單點智能到整體智能的路徑依然沒有打通。知識圖譜作為人工智能的底層技術(shù)之一,其技術(shù)成熟度也在制約著人性化的交互方式的進(jìn)展。
專注語音技術(shù)的場景化落地,以DUI開放平臺構(gòu)建AI生態(tài)
那么,專注于人性化智能語音交互技術(shù)的思必馳,在智能語音的瓶頸突破方面又將如何破局呢?
龍夢竹介紹到,思必馳專注于打造人性化的語音交互技術(shù),對于立足于技術(shù)的思必馳來說,技術(shù)是根本,但并不是瓶頸,如何將技術(shù)應(yīng)用到現(xiàn)實的場景中,用戶體驗和技術(shù)同等重要:一方面,思必馳與內(nèi)容資源方合作積極擴(kuò)展第三方內(nèi)容資源,為用戶提供更多的內(nèi)容服務(wù);另一方面,思必馳將繼續(xù)在專注細(xì)分領(lǐng)域的同時著力構(gòu)建開放平臺,賦能更多智能硬件,助力傳統(tǒng)企業(yè)轉(zhuǎn)型。在生態(tài)方面,思必馳于2016年成立馳星創(chuàng)投,得到了元禾資本、富士康、清華控股等LP的支持,旗下?lián)碛袃芍Щ穑謩e為2億元天使基金和10億元成長基金,專注投資人工智能和智能交互產(chǎn)業(yè)早期項目。思必馳在AI領(lǐng)域全面布局,加速在物聯(lián)網(wǎng)領(lǐng)域的深入和拓展,打造AI生態(tài),賦能萬物。
硬件廠商與語音交互技術(shù)公司的傳統(tǒng)合作模式中雙方的溝通成本較高,,在自定義產(chǎn)品功能、系統(tǒng)迭代、內(nèi)容升級等方面往往會存在延遲,造成了開發(fā)周期長、更新迭代慢等問題。此外,智能語音交互技術(shù)的整個鏈條較長,涉及到前端信號處理、喚醒、識別、語義、對話、問答等諸多核心技術(shù),對于開發(fā)者來說比較復(fù)雜,有一定的技術(shù)門檻。因此,向開發(fā)者開放語音交互技術(shù)、讓用戶自定義產(chǎn)品、大規(guī)模定制開發(fā)成為必然方向,思必馳DUI開放平臺也應(yīng)運而生。
出于好奇,筆者也注冊了一個DUI平臺賬號,快速體驗了一把平臺上的“技能包”。只要在左側(cè)輸入內(nèi)容,右側(cè)同步輸出代碼。作為“代碼盲”,從未感覺到原來技術(shù)可以離我們?nèi)绱酥?。?dāng)技術(shù)做到如此貼近開發(fā)者的時候,技術(shù)與行業(yè)場景、整體智能的融合還會遠(yuǎn)么?

與龍夢竹的交談中,總是能深深的感覺到她對DUI平臺的篤信與自豪,或許這種自信源于專注領(lǐng)域的成功和對技術(shù)的信仰吧。伴隨著人工智能與物聯(lián)網(wǎng)的融合, DUI+IOT的智能產(chǎn)業(yè)生態(tài)構(gòu)建。思必馳還將帶來哪些驚喜,我們拭目以待。