WOT2018算法模型分論壇:數(shù)據(jù)洪流爆發(fā),如何用算法突破瓶頸
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年11月30日-12月1日,由51CTO主辦的WOT2018全球人工智能技術(shù)峰會(huì)在北京粵財(cái)JW萬(wàn)豪酒店召開(kāi)。本屆峰會(huì)從人工智能技術(shù)賦能行業(yè)升級(jí)的角度出發(fā),緊跟技術(shù)潮流,緊抓時(shí)事熱點(diǎn),覆蓋人工智能平臺(tái)工具、算法模型、語(yǔ)音視覺(jué)等技術(shù)主題內(nèi)容,帶來(lái)了一場(chǎng)AI前沿理論與***技術(shù)激烈碰撞的知識(shí)盛宴!
眾所周知,人工智能離不開(kāi)計(jì)算、算法、數(shù)據(jù)三大要素。隨著數(shù)據(jù)洪流的爆發(fā)和算法的突破,人工智能在自然語(yǔ)言處理、圖像識(shí)別、人機(jī)交互等領(lǐng)域取得了重大突破,使得幾乎所有的機(jī)器輔助功能變?yōu)榭赡?,例如智能推薦、智能穿戴等應(yīng)用已經(jīng)成功落地,無(wú)人駕駛汽車、預(yù)防性的醫(yī)療保健等也即將成為現(xiàn)實(shí)。
那么,企業(yè)應(yīng)該如何利用先進(jìn)的算法加速人工智能的應(yīng)用落地呢?本屆WOT峰會(huì)的《算法模型》分論壇上,來(lái)自三角獸技術(shù)副總裁陳華榮,捷通華聲MT及NLP算法負(fù)責(zé)人的邢啟洲,惟客數(shù)據(jù)算法負(fù)責(zé)人李翔,分別從基于語(yǔ)義理解的智能交互、遠(yuǎn)不止翻譯、新零售場(chǎng)景下的AI落地探索三個(gè)不同的主題,為到場(chǎng)的聽(tīng)眾帶來(lái)了一場(chǎng)算法模型的饕餮盛宴。
三角獸技術(shù)副總裁陳華榮:基于語(yǔ)義理解的智能交互
三角獸技術(shù)副總裁陳華榮主要介紹了自然語(yǔ)言處理(NLP)技術(shù)的發(fā)展和基于語(yǔ)義理解的對(duì)話系統(tǒng)和智能交互系統(tǒng),并重點(diǎn)介紹了語(yǔ)義理解的場(chǎng)景落地及實(shí)戰(zhàn)經(jīng)驗(yàn)。
感知智能解決的是看見(jiàn)、聽(tīng)見(jiàn)的問(wèn)題,更多是接收外面的信息,還做不到聽(tīng)得懂和看得懂,當(dāng)然也無(wú)法進(jìn)行決策。陳華榮表示,要讓系統(tǒng)會(huì)理解、會(huì)思考,就必須要具備認(rèn)知智能,讓系統(tǒng)去理解語(yǔ)言、掌握語(yǔ)言,利用其掌握的知識(shí)去推理。目前,認(rèn)知智能還處在比較初級(jí)的階段,還做不到推理。所以,人工智能還有很長(zhǎng)的路要走。
最初的自然語(yǔ)言用的是傳統(tǒng)的NLP算法,是通過(guò)分析句中結(jié)構(gòu)來(lái)理解語(yǔ)義,由于語(yǔ)言千變?nèi)f化,異常復(fù)雜,因此沒(méi)有辦法基于NLP算法搭建比較好的落地產(chǎn)品。深度學(xué)習(xí)出現(xiàn)之后,在聲音和圖像的識(shí)別上得到了成功應(yīng)用,也慢慢應(yīng)用到了自然語(yǔ)言處理方面。陳華榮以擅長(zhǎng)捕捉局部和全局特征的CNN 為例,詳細(xì)介紹了深度學(xué)習(xí)的優(yōu)勢(shì)。他表示,基于深度學(xué)習(xí)的情緒識(shí)別、文本分類、機(jī)器翻譯、閱讀理解、文本摘要等等,成為當(dāng)前行業(yè)的熱點(diǎn)。
在接下來(lái)的演講中,陳華榮從智能手機(jī)、智能IoT和智能客服三個(gè)不同的場(chǎng)景應(yīng)用出發(fā),為大家詳細(xì)介紹了三角獸從技術(shù)到商業(yè)化落地應(yīng)用的過(guò)程。據(jù)介紹,三角獸的商業(yè)化落地不僅包含開(kāi)放域聊天引擎、通用對(duì)話引擎等多種對(duì)話引擎在終端設(shè)備上的應(yīng)用,如智能電視、智能音箱、手機(jī)、兒童手表等等,而且還提供了輔助功能模塊,如情緒分析、語(yǔ)義糾錯(cuò)、客服質(zhì)檢、內(nèi)容過(guò)濾等,為用戶提供了強(qiáng)大的內(nèi)容模糊語(yǔ)義理解能力的算法。
捷通華聲MT及NLP算法負(fù)責(zé)人邢啟洲:遠(yuǎn)不止翻譯
捷通華聲MT及NLP算法負(fù)責(zé)人邢啟洲本次演講主要圍繞神經(jīng)機(jī)器翻譯相關(guān)技術(shù)及其應(yīng)用展開(kāi),對(duì)機(jī)器翻譯、靈云機(jī)器翻譯框架、Transformer模型、翻譯中其他設(shè)計(jì)的算法、業(yè)界翻譯產(chǎn)品現(xiàn)狀、挑戰(zhàn)及未來(lái)機(jī)器翻譯發(fā)展趨勢(shì)六大主題進(jìn)行了細(xì)致的講解。
邢啟洲表示,隨著人工智能、深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)的發(fā)展,神經(jīng)機(jī)器翻譯邁入了一個(gè)新的時(shí)代,特別是自從去年谷歌發(fā)布《Attention Is All You Need》文章之后,在機(jī)器翻譯領(lǐng)域取得了長(zhǎng)足的進(jìn)步。從幾年前比較流行的統(tǒng)計(jì)機(jī)器翻譯SMT ,到這兩年比較火的神經(jīng)機(jī)器翻譯NMT ,都是機(jī)器翻譯的框架。目前,靈云機(jī)器翻譯的框架,就是將一個(gè)有噪音、不規(guī)則、有各種復(fù)雜符號(hào)的文本 ,通過(guò)文本前處理,包括文本清洗、大小寫(xiě)轉(zhuǎn)換、分詞等等,把收到的Input轉(zhuǎn)換成一種利于機(jī)器去處理的形式。然后,通過(guò)命名實(shí)體識(shí)別,把句子送進(jìn)翻譯模型,最終輸出一個(gè)目標(biāo)語(yǔ)言翻譯句子。***,再做一次命名實(shí)體識(shí)別,通過(guò)文本后處理進(jìn)行反向還原,***化還原用戶實(shí)際輸入的格式,最終將翻譯結(jié)果呈現(xiàn)給大家。
接著,邢啟洲為大家詳細(xì)解讀了機(jī)器翻譯各個(gè)步驟的技術(shù)細(xì)節(jié)以及捷通華聲所采用的技術(shù)、遇到的難題和總結(jié)的經(jīng)驗(yàn)。他表示,要想讓機(jī)器翻譯成為一個(gè)成熟的產(chǎn)品,肯定不是翻譯本身的能力有多強(qiáng),而是要結(jié)合各種人工智能技術(shù),比如ASR技術(shù)、TTS語(yǔ)音合成技術(shù)、OCR技術(shù)等 等。因此,多技術(shù)融合才是翻譯的未來(lái)發(fā)展趨勢(shì)。
邢啟洲強(qiáng)調(diào),多模態(tài)翻譯和語(yǔ)音識(shí)別、多語(yǔ)化翻譯、多譯文翻譯、篇章級(jí)翻譯、離線端翻譯、隱私化翻譯等都是未來(lái)翻譯的發(fā)展方向,但都面臨著語(yǔ)料缺失的問(wèn)題,目前可以通過(guò)遷移學(xué)習(xí)、無(wú)監(jiān)督或者半監(jiān)督的方式去做語(yǔ)料增強(qiáng)等等,但現(xiàn)有的方法還是無(wú)法達(dá)到滿意的程度,這是未來(lái)要重要突破的難題。
惟客數(shù)據(jù)算法負(fù)責(zé)人李翔:新零售場(chǎng)景下的AI落地探索
惟客數(shù)據(jù)算法負(fù)責(zé)人李翔的演講圍繞新零售場(chǎng)景下的AI落地探索展開(kāi),他認(rèn)為雖然零售場(chǎng)景已經(jīng)有很多的維度和數(shù)量,但惟客數(shù)據(jù)的***目標(biāo),就是喚醒沉睡的數(shù)據(jù),讓數(shù)據(jù)物盡其用,讓零售商通過(guò)數(shù)據(jù)來(lái)經(jīng)營(yíng)自己的客戶。
對(duì)于新零售的理解,李翔認(rèn)為其實(shí)就是換一種方式讓零售行業(yè)做得更好。他表示,如果把新零售比做一個(gè)黑盒子,它的輸入就是數(shù)據(jù),輸出就是服務(wù),目的就是讓傳統(tǒng)零售行業(yè)為客戶提供更好的、更優(yōu)質(zhì)的服務(wù)。如果再把這個(gè)目標(biāo)進(jìn)行拆分,那么***點(diǎn)就是讓零售行業(yè)的店家更好地去理解自己的客戶,第二點(diǎn)就是為客戶提供個(gè)性化、定制化的優(yōu)質(zhì)服務(wù)。
在接下來(lái)的演講中,李翔圍繞數(shù)據(jù)和服務(wù),為到場(chǎng)的觀眾詳細(xì)介紹了惟客數(shù)據(jù)的做法和經(jīng)驗(yàn),并分享了其核心的算法內(nèi)容,如人臉識(shí)別、物品識(shí)別等數(shù)據(jù)模型。李翔表示,AI在新零售行業(yè)中的場(chǎng)景應(yīng)用雖然有很多種,但首先要解決“誰(shuí)才是你客戶”的問(wèn)題,只有知道了自已的客戶是誰(shuí),才能有針對(duì)性的做出解決方案。
在搞清楚了自己的客戶是誰(shuí)之后,接下來(lái)就是方案的選型,是選擇第三方成熟公司的方案,還是自己設(shè)計(jì)方案,一是考慮成本,二是不要只選擇一個(gè)模型。據(jù)介紹,如何從視頻流中去檢測(cè)人臉,并把人臉提取后進(jìn)行識(shí)別并分析,惟客數(shù)據(jù)遇到了難題。他們嘗試采用了三種方案,首先是普通攝像頭的方案,其***優(yōu)勢(shì)就是成本很低。第二是采用了手機(jī)攝像頭的方案,成本仍舊很低。第三是采用了專業(yè)級(jí)攝像頭的方案,雖然成本高,但取得的效果也是***的。因此,惟客數(shù)據(jù)最終選擇了第三種方案。
李翔表示,通過(guò)在攝像頭端對(duì)視頻流進(jìn)行分析,對(duì)人臉檢測(cè),把人臉抓取出來(lái),之后經(jīng)過(guò)MTCNN對(duì)人臉進(jìn)行更深層次的提取,這樣就可以通過(guò)很低的計(jì)算成本實(shí)現(xiàn)了人臉的識(shí)別與深度分析。
以上內(nèi)容是51CTO記者根據(jù)WOT2018全球人工智能技術(shù)峰會(huì)的《算法模型》分論壇演講內(nèi)容整理,更多關(guān)于WOT的內(nèi)容請(qǐng)關(guān)注51cto.com。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】