偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

如何評(píng)測(cè)語(yǔ)音技能的智能程度之交互流暢

企業(yè)動(dòng)態(tài)
當(dāng)用戶(hù)發(fā)起需求后,【意圖理解】在前,【服務(wù)提供】在后,基本上已經(jīng)構(gòu)成了一輪完整閉環(huán)。

 當(dāng)用戶(hù)發(fā)起需求后,【意圖理解】在前,【服務(wù)提供】在后,基本上已經(jīng)構(gòu)成了一輪完整閉環(huán)。

[[328415]]

之所以把【交互流暢】這個(gè)點(diǎn)作為一個(gè)單獨(dú)維度拆解出來(lái),是因?yàn)槠湄灤┦冀K。如果這個(gè)模塊的內(nèi)容如果處理不好,將全程傷害體驗(yàn)。

 

本篇文章為大家?guī)?lái)【交互流暢】維度的評(píng)測(cè)點(diǎn)拆解。

這個(gè)模塊,重點(diǎn)考量智能助手各個(gè)性能指標(biāo)及交互體驗(yàn)層面的表現(xiàn)。

【交互流暢】(1)服務(wù)穩(wěn)定性

“正常運(yùn)行”、“不出bug”、“魯棒性好”。

評(píng)測(cè)點(diǎn)已經(jīng)講完了,十分清晰,幾乎每一個(gè)互聯(lián)網(wǎng)從業(yè)者都能夠說(shuō)出個(gè)1234,然后呢?

穩(wěn)定不好,這類(lèi)問(wèn)題可大可小,小點(diǎn)就是網(wǎng)絡(luò)繁忙,不給你任何反饋,大到極致,機(jī)器人可以反動(dòng)搞事情,“愚蠢的人類(lèi)啊,阿西莫夫的機(jī)器人三定律也救不了你們。”

 

好了,開(kāi)個(gè)玩笑。實(shí)際上,定義“what”容易,解決“how”往往都才是考量業(yè)務(wù)理解。

所以,在過(guò)往我經(jīng)常會(huì)問(wèn)面試者的問(wèn)題有一個(gè),你曾經(jīng)做過(guò)的智能助手產(chǎn)品,出過(guò)哪些問(wèn)題,你是如何解決的?

不同的人回答不同,對(duì)于這類(lèi)命題,才更有探索價(jià)值。

一般情況下,回答這些是技術(shù)的問(wèn)題,往往都很糟糕,實(shí)際上,每個(gè)公司的穩(wěn)定性業(yè)務(wù)保障是需要一個(gè)體系來(lái)承擔(dān)的。

所以能得分的面試回答是,把影響穩(wěn)定性的故障進(jìn)行一個(gè)分類(lèi),并且設(shè)計(jì)好處理路徑。

 

這里只有大類(lèi)別,單單一個(gè)業(yè)務(wù)后臺(tái),就能做很多范圍細(xì)分。故障表現(xiàn)情況例如:崩潰、局部故障、弱網(wǎng)環(huán)境、狀態(tài)更新、請(qǐng)求超時(shí)、并發(fā)表現(xiàn)……嚴(yán)重程度不一致,此處不逐一展開(kāi)。

出過(guò)哪些問(wèn)題分類(lèi)回答完畢,你是如何解決的呢?是后續(xù)的一個(gè)命題。

一般情況下,公司的業(yè)務(wù)流程是這樣運(yùn)轉(zhuǎn)的。

 

這里有3個(gè)細(xì)節(jié)。

第一個(gè)是反饋的行為折損。根據(jù)歷史數(shù)據(jù)表現(xiàn),1個(gè)問(wèn)題被報(bào)上來(lái),背后往往有至少10個(gè)以上的用戶(hù)遇見(jiàn)過(guò),只是用戶(hù)懶/報(bào)問(wèn)題麻煩,沒(méi)有報(bào)而已。

第二個(gè)是反饋的信息折損,客服問(wèn):你做了什么操作導(dǎo)致的崩潰?用戶(hù)答:我也不知道,就崩潰了。這種情況,是不利于排查和定位問(wèn)題的。

第三個(gè)是“解決方案的設(shè)計(jì)”,這里也分為“臨時(shí)解決方案”和“全局最優(yōu)解決方案”兩說(shuō)。

下圖是一個(gè)信息化的風(fēng)控結(jié)構(gòu),做過(guò)相關(guān)模塊的,懂得自然懂,篇幅太長(zhǎng),此處不展開(kāi)。

 

所以,在考量服務(wù)穩(wěn)定性上有兩個(gè)大層面,一個(gè)是智能助手本身的穩(wěn)定性表現(xiàn),二個(gè)是在服務(wù)用戶(hù)的過(guò)程中,如何規(guī)避,以及遇見(jiàn)問(wèn)題后的業(yè)務(wù)響應(yīng)速度表現(xiàn)。

服務(wù)穩(wěn)定性的考量是以一定周期、頻次進(jìn)行考量才是科學(xué)合理的。

【交互流暢】(2)響應(yīng)速度/流暢度

服務(wù)穩(wěn)定性保障了之后,接下來(lái)就是速度。

語(yǔ)音交互這件事,本身就是因?yàn)檎Z(yǔ)音輸入的高效性。

當(dāng)用戶(hù)發(fā)出了需求,希望盡快拿到反饋,

現(xiàn)在的用戶(hù)極其沒(méi)有耐心,速度一旦過(guò)慢,注定會(huì)被棄而不用。

 

而在智能語(yǔ)音助手交互對(duì)話(huà)的過(guò)程中,又包含哪幾個(gè)階段呢?

 

先明確一點(diǎn),一味追求快并非是好。

1、人類(lèi)喚醒后,計(jì)算器的響應(yīng)靈敏度,靈敏度太強(qiáng)(誤喚醒)或太弱(沒(méi)反應(yīng))都不好,當(dāng)然如果升級(jí)下維度,還可以添加場(chǎng)景,比如噪音下喚醒,遠(yuǎn)場(chǎng)喚醒等。靈敏度是可以調(diào)試的,以表現(xiàn)合適最好。

2、人類(lèi)表述了自己需求后,ASR有兩種方案,一種是邊識(shí)別邊轉(zhuǎn)換文本,另外一種是表述完畢后一口氣轉(zhuǎn)換為文本。

3、業(yè)務(wù)邏輯處理表現(xiàn),其實(shí)是NLP領(lǐng)域最為核心的部分,也是最為耗時(shí)的部分,從效率角度上而言,此處盡管追求越快越好。

4、這里的語(yǔ)音播放,不是越快越好,而是合適就好,語(yǔ)速太快會(huì)給人一種輕浮及不穩(wěn)重的感受,太慢則顯得很笨以及可能造成不耐煩。而反饋樣式則需要盡快呈現(xiàn),有些智能助手語(yǔ)音播放完畢了,結(jié)果下面的內(nèi)容還沒(méi)加載到位。

5、人類(lèi)總計(jì)2次交互,一次喚醒,一次表達(dá)意圖,這2個(gè)行為過(guò)后,等待AI反饋。也就是說(shuō),當(dāng)用戶(hù)說(shuō)完話(huà)后的下一秒,助手要同時(shí)處理,識(shí)別+理解+接口查詢(xún)+反饋四個(gè)階段,這個(gè)過(guò)程中,全部都是用戶(hù)的等待狀態(tài)。

人們?nèi)ワ埖挈c(diǎn)完了菜,等上菜的過(guò)程中,中間服務(wù)員還會(huì)過(guò)來(lái)幫忙緩解,這個(gè)過(guò)程較長(zhǎng),一定要考慮好等待體驗(yàn)管理,不至于讓用戶(hù)無(wú)聊。

前后端共同協(xié)作,添加一些語(yǔ)音播報(bào),模態(tài)框提示,漸隱消失提示,動(dòng)畫(huà)效果,來(lái)管理用戶(hù)的等待體驗(yàn)。

而有些無(wú)屏的音箱則需要使用等待、加載、成功等光效表現(xiàn)來(lái)管理用戶(hù)的等待體驗(yàn)過(guò)程。

 

所以,在響應(yīng)速度/流暢度這個(gè)維度上,不同的情況不同的對(duì)待,以合適最好。

【交互流暢】(3)交互形式豐富度

每一種交互形式的存在,都有著其依賴(lài)的場(chǎng)景。

 

下圖是我嘗試窮舉人類(lèi)的輸入行為(盡力做到MECE)。

 

點(diǎn)觸、語(yǔ)音、手勢(shì)、點(diǎn)頭搖頭、人臉識(shí)別、聲紋、指紋驗(yàn)證等等均算在內(nèi)。

這一塊真的不需要多講,除了腦機(jī)接口,基本上都玩過(guò),體驗(yàn)過(guò)的都會(huì)覺(jué)得其有意思的地方。

[[328418]]

[[328419]]

 


 

交互形式豐富度,評(píng)測(cè)點(diǎn)已解釋完畢,在未來(lái),一定是多模態(tài)交互,來(lái)適應(yīng)各種各樣的業(yè)務(wù)場(chǎng)景。

說(shuō)一點(diǎn),產(chǎn)品經(jīng)理應(yīng)該修煉的部分。

筆者有一個(gè)出門(mén)問(wèn)問(wèn)的耳機(jī),它是智能助手的操控延伸。在提供創(chuàng)新體驗(yàn)的同時(shí),弄明白了是什么(what),基于此去探究為什么(why)以及怎么辦(how)。

 

所以,筆者認(rèn)為產(chǎn)品經(jīng)理應(yīng)該修煉的部分。

盡量多的去使用智能硬件,把工作體驗(yàn)變成日常,以培養(yǎng)敏感度。

弄清楚這些交互方式、元器件連接方式背后的技術(shù)實(shí)現(xiàn)原理。

每種技術(shù)方案都有多種實(shí)現(xiàn)方式,知曉其優(yōu)劣勢(shì)及實(shí)現(xiàn)成本。

這三層修煉是遞進(jìn)關(guān)系。只有這些把這類(lèi)東西融入到了我們的生活之中,敏感性才培養(yǎng)得起來(lái),繼而去加深理解,如此才更有可能做創(chuàng)新。

我們今天所熟知的眾多的科學(xué)以及專(zhuān)利技術(shù)的發(fā)明者,其實(shí)都是根據(jù)前人的經(jīng)驗(yàn)進(jìn)行的某種程度上的改進(jìn)。從結(jié)果上來(lái)看,主要有兩種改進(jìn)方向。

一種是將一個(gè)原本在實(shí)驗(yàn)室里面理論上可行,變成大規(guī)模批量生產(chǎn)的方案。

另一種則是根據(jù)已有的技術(shù)發(fā)明,發(fā)現(xiàn)一些“居然這個(gè)技術(shù)還可以被這樣使用” 的方案。

蘋(píng)果公司在技術(shù)研發(fā)上,并沒(méi)有什么特別優(yōu)秀的表現(xiàn),但是在整合以及運(yùn)用技術(shù)的這件事情上,則是優(yōu)秀中的代表。市面上的絕大多數(shù)的手機(jī)公司的研發(fā)部門(mén),應(yīng)該都叫技術(shù)方案整合商更為貼切。

只有將自己的日常浸潤(rùn)到各種類(lèi)型的交互體驗(yàn)里,進(jìn)而去理解實(shí)現(xiàn)方案背后的技術(shù)原理,才更有可能做出創(chuàng)新啊!

【交互流暢】(4)新手教學(xué)表現(xiàn)

我第一次給父母體驗(yàn)‘小愛(ài)同學(xué)’的時(shí)候,他們是需要我的幫助才能使用。

什么是喚醒;什么是監(jiān)聽(tīng);什么時(shí)候你說(shuō)話(huà)它會(huì)響應(yīng)/不響應(yīng);覺(jué)得羅嗦,如何打斷對(duì)方。

這個(gè)教學(xué)行為大概要持續(xù)一小會(huì),言傳身教才能夠?qū)W出如何進(jìn)行語(yǔ)音交互。

如果沒(méi)有我,我的父母將無(wú)法上手。這種依賴(lài)人,在旁邊教的東西,實(shí)在是學(xué)習(xí)成本太高。

而當(dāng)我們的產(chǎn)品被用戶(hù)首次體驗(yàn)的時(shí)候,如果沒(méi)有新手教學(xué),用戶(hù)也許就呆滯在那里,并不知道如何使用。

新手教學(xué)體驗(yàn)是非常重要的一個(gè)環(huán)節(jié)。

體驗(yàn)各家智能語(yǔ)音助手,在這一塊的表現(xiàn)上各不一致,故而列為評(píng)測(cè)點(diǎn)。

行業(yè)新的新手引導(dǎo)教學(xué)其實(shí)非常多的種類(lèi),滑屏海報(bào),蒙版遮罩,文字tips,互動(dòng)式引導(dǎo)。

簡(jiǎn)單一分為二的說(shuō),大體可以分為,基本操作教學(xué),以及對(duì)應(yīng)業(yè)務(wù)的教學(xué)。

 

在考量這個(gè)業(yè)務(wù)表現(xiàn)的維度上,基本操作教學(xué)必須得有。而具體業(yè)務(wù)教學(xué),則是具體問(wèn)題具體設(shè)計(jì)。

百度地圖的新手引導(dǎo)就做得十分友好?;旧蠟樾《葘?dǎo)航的每個(gè)業(yè)務(wù)能力配備了沉浸式引導(dǎo)方案。

 

這一塊是參照游戲行業(yè)的解決方案。就我過(guò)往對(duì)小度的體驗(yàn),其實(shí)有很幾次改版了,不斷迭代演化至今。

最好的交互設(shè)計(jì)其實(shí)是不需要新手引導(dǎo)的,如同微信一樣自然。

在一個(gè)普遍使用點(diǎn)觸操作習(xí)慣的年代,如何讓用戶(hù)體驗(yàn)這種新的交互體驗(yàn)方式?壓力就在新手教學(xué)上。學(xué)的會(huì)就用,學(xué)不會(huì)就丟棄。

嘗鮮體驗(yàn)過(guò)后,以后也會(huì)(改變習(xí)慣)使用語(yǔ)音尋求業(yè)務(wù),壓力則在業(yè)務(wù)設(shè)計(jì)上。方便就用,不方便就丟棄。

這是一個(gè)遞進(jìn)邏輯。只有基本操作掌握了才有后面的(改變習(xí)慣)使用,把用戶(hù)當(dāng)成小白的新手教學(xué)行為,一定得做好!

【交互流暢】(5)全雙工交互表現(xiàn)

全雙工(Full Duplex)是通訊傳輸?shù)囊粋€(gè)術(shù)語(yǔ)。通信允許數(shù)據(jù)在兩個(gè)方向上同時(shí)傳輸。

先用通俗的例子比喻下。

單工:類(lèi)似聽(tīng)廣播。

單向傳遞信息,一個(gè)人只能聽(tīng)另一個(gè)人說(shuō)。

半雙工:類(lèi)似對(duì)講機(jī)。

甲:洞幺洞幺,能不能聽(tīng)到我說(shuō)話(huà),over。

乙:可以聽(tīng)到,over。

全雙工:類(lèi)似打電話(huà)。

甲:喂,還記得我的聲音么?我是…… 乙:啊,是你小子啊……

雙方可以各說(shuō)各的,可以互相打斷。

人機(jī)交互追求更加自然流暢,這一點(diǎn)必不可少。

當(dāng)前的語(yǔ)音助手,只有在進(jìn)入監(jiān)聽(tīng)狀態(tài)才可以做出反饋。

而進(jìn)入監(jiān)聽(tīng)的兩種情況,一種是使用[喚醒詞],完成喚醒/打斷的動(dòng)作。

另一種是AI判斷業(yè)務(wù)沒(méi)完,做出引導(dǎo)式的追問(wèn),然后進(jìn)入監(jiān)聽(tīng)狀態(tài)。

例如:

用戶(hù):我想看最近上映的電影。

助手:為你找到如下電影,你可以對(duì)我說(shuō)看第幾部。播放完畢后進(jìn)入監(jiān)聽(tīng)狀態(tài)。

其實(shí)助手第一時(shí)間在屏幕上展示了電影列表的搜索結(jié)果,但是總得把語(yǔ)音念完……。

作為用戶(hù)而言,我已經(jīng)看到了助手給我的展示結(jié)果,也知道你的后續(xù)話(huà)術(shù)套路,我會(huì)迫不及待的使用[喚醒詞],完成打斷行為……使用過(guò)的都會(huì)感受到這種情況的心累。

而在全雙工的能力加持下,即為,你播報(bào)你的,我說(shuō)我的,不用等你念完,才進(jìn)入監(jiān)聽(tīng)狀態(tài),你念一半的時(shí)候,我搶話(huà)到下一步驟,你根據(jù)我的節(jié)奏推進(jìn)業(yè)務(wù)就好。

 

還有一種技術(shù)方案相信從業(yè)者們也不陌生,就是基于當(dāng)前語(yǔ)義場(chǎng)景下的“判斷為無(wú)效內(nèi)容后的拒絕響應(yīng)”。

例子:我想聽(tīng)……嗯,我想想,哦對(duì)了,那個(gè)周杰倫的青花瓷

識(shí)別出用戶(hù)當(dāng)前說(shuō)的話(huà)是不是給它的指令,能過(guò)濾掉無(wú)效的停頓,語(yǔ)氣助詞等干擾信息,再做出反應(yīng)。

這就是全雙工所指的“瞬間雙向”表現(xiàn),更接近人與人之間的自然對(duì)話(huà),提升了交互體驗(yàn)。

階段性結(jié)尾

 

同樣的,在【交互流暢】這個(gè)單元模塊,有更多評(píng)測(cè)點(diǎn)去列舉,但是受限于篇幅以及能力所限,刪掉的一些內(nèi)容。保留以及刪除評(píng)測(cè)點(diǎn)的原則,也是基于評(píng)測(cè)指標(biāo)的普適性。

同樣用提問(wèn)的方式,列舉一下我刪除掉的考核點(diǎn)。

 

 

第(6)點(diǎn),列舉一個(gè)我玩游戲多多自走棋,體驗(yàn)游戲助手的例子。敏感詞,會(huì)在很多的地方出現(xiàn)。防止內(nèi)容攻擊,保護(hù)安全的,特別是大公司,往往會(huì)用上一個(gè)敏感詞庫(kù)過(guò)濾處理,相信很多的人都遇見(jiàn)過(guò),有些給你反饋,有些則直接給你和諧掉了。顯然是影響交互體驗(yàn)流暢度的。造成這種情況的顯然是政策問(wèn)題。

 

第(7)點(diǎn),未來(lái)的交互體驗(yàn)過(guò)程中,多硬件終端,多場(chǎng)景,有屏無(wú)屏的交互體驗(yàn)方案,這是一個(gè)“現(xiàn)階段各家都沒(méi)做,而在未來(lái)各家一定會(huì)做”的評(píng)測(cè)點(diǎn)。

如果列舉其例子,問(wèn)題以及探討解決方案起來(lái),篇幅就過(guò)長(zhǎng)了,就目前AI跨平臺(tái)使用表現(xiàn)而言,故現(xiàn)階段舍棄。

 

第(8)點(diǎn),完成任務(wù)時(shí)候的成本考量。這個(gè)里面涉及一些語(yǔ)音識(shí)別、語(yǔ)義理解的層面。比如,任務(wù)流的多輪對(duì)話(huà)是分層次的,而當(dāng)用戶(hù)一口氣給助手提供多個(gè)查詢(xún)槽位,能否給予結(jié)果。比如,在一些支付和驗(yàn)證的層面,視覺(jué)和聲紋讓用戶(hù)付出的代價(jià)幾何等等。助手取硬件權(quán)限(讀取GPS,讀取短信等)時(shí)的表現(xiàn)。

在滿(mǎn)足用戶(hù)需求的時(shí)候一定有方案,而不同方案之間的取舍考量就存在比較關(guān)系了。

筆者在設(shè)計(jì)業(yè)務(wù)的時(shí)候,同時(shí)也會(huì)考量用戶(hù)的隱私保護(hù)安全。

你要安全,就加判斷確認(rèn),加驗(yàn)證,影響流暢度。

你要流暢,就替用戶(hù)配置更多的默認(rèn)選項(xiàng),影響安全。

“流暢”和“安全”本身就是一個(gè)互相沖突的命題。此處沒(méi)有對(duì)錯(cuò),只有選擇。

【交互流暢】是一個(gè)非常重要的全局性指標(biāo),貫穿【意圖理解】和【服務(wù)提供】始終。如果這個(gè)維度的評(píng)測(cè)方向如果處理不好,將全程傷害體驗(yàn)。

以上,關(guān)于第三大維度【交互流暢】的諸多考量點(diǎn),就此完結(jié)。

責(zé)任編輯:武曉燕 來(lái)源: 51CTO專(zhuān)欄
相關(guān)推薦

2020-05-28 10:15:06

語(yǔ)音技能服務(wù)提供

2020-06-08 09:48:31

語(yǔ)音技能智能

2020-05-21 10:24:59

語(yǔ)音技能智能

2020-06-15 13:49:41

語(yǔ)音技能指標(biāo)

2014-10-27 14:18:06

Material De交互響應(yīng)

2018-03-09 15:25:47

IOT語(yǔ)義交叉

2012-01-13 10:24:37

ibmdw

2014-04-14 11:40:47

云知聲語(yǔ)音

2022-11-03 16:31:08

語(yǔ)音智能語(yǔ)音識(shí)別

2020-02-10 08:20:48

智能語(yǔ)音人工智能物聯(lián)網(wǎng)

2021-04-13 06:13:33

微軟人工智能語(yǔ)音技術(shù)

2021-06-25 16:10:05

人工智能AI

2023-07-13 06:55:00

2020-05-19 08:40:19

人工智能智能語(yǔ)音交互智能語(yǔ)音設(shè)備

2019-05-27 08:00:00

2020-04-20 10:10:44

NLPAI語(yǔ)音

2020-06-24 07:44:45

JavaScript開(kāi)發(fā)代碼

2025-06-20 09:00:00

智能體訓(xùn)練模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)