昨天的阿里云棲大會(huì)上,阿里宣布對(duì)外開放語音客服機(jī)器人服務(wù)。 這項(xiàng)服務(wù)其實(shí)在阿里系自身的服務(wù)中已經(jīng)運(yùn)用和訓(xùn)練了很久,以下是對(duì)其中的一項(xiàng)服務(wù)“阿里小蜜”的簡(jiǎn)單體驗(yàn)。
一進(jìn)入界面,產(chǎn)品提供了問法和可能需要的操作。推薦的用戶輸入方式是語音。
可以通過點(diǎn)擊“剁手有小蜜”或者直接說出“找好貨”來說出需求。系統(tǒng)自動(dòng)給出了反饋(這里還起到一個(gè)幫助用戶理解要怎么跟機(jī)器人對(duì)話的作用)。
而我提出“買火車票”的這個(gè)需求時(shí),則反饋回來了我應(yīng)該如何在淘寶上完成買火車的幫助說明信息(見下圖)。
而在給出的反饋信息,提供了向上和向下兩個(gè)拇指。通過用戶的反饋,來提高系統(tǒng)的知識(shí)能力。

在對(duì)話中,我中途切換到天氣查詢、期望其反饋天氣情況。但顯然其仍然認(rèn)為我的目標(biāo)是在“挑好貨”,不予理會(huì)我查天氣的需求,而直接引導(dǎo)往下一層使用。(這種中途轉(zhuǎn)換目標(biāo)的情況,在語音交互上應(yīng)該還是有難度的~)
不過,說好的“這個(gè)幾款”呢?本次體驗(yàn)在失敗中結(jié)束。
一點(diǎn)絮叨:
目前,智能語音交互從技術(shù)上到行業(yè)應(yīng)用上都沒有很成熟,存在一些明顯無法達(dá)到用戶預(yù)期的缺陷。在設(shè)計(jì)上需要立足于這種缺陷、充分利用多種手段和渠道(如硬件設(shè)備、APP/網(wǎng)頁等)去幫助用戶完成目標(biāo)。
一些補(bǔ)充信息(來自三角獸)
作為行業(yè)型應(yīng)用,客服機(jī)器人屬于典型的任務(wù)驅(qū)動(dòng)的多輪對(duì)話交互。一個(gè)典型的任務(wù)驅(qū)動(dòng)的多輪對(duì)話語音交互包含如下幾個(gè)典型的流程:
1、語言的理解:簡(jiǎn)單講,就是講用戶自然而然說出的話,轉(zhuǎn)換成結(jié)構(gòu)化的“語義表示”。在語音交互中,這種“語義表示”包含兩部分:
(1)communication function:表示用戶query的類型,比如陳述需求、詢問屬性、否定、選擇疑問等等。
(2)slot-value pairs:一個(gè)slot-value pair表達(dá)一個(gè)限定條件。這一理解為,將用戶的目標(biāo)分解成一個(gè)一個(gè)的小任務(wù)(目標(biāo)單元)。
舉例說明:“我要西二旗附近的川菜”對(duì)應(yīng)的communication function就是陳述需求,slot-value pairs有“西二旗”和“川菜”。
在對(duì)話系統(tǒng)中,口語化的處理是必不可少的,必須具備非嚴(yán)謹(jǐn)語言,和語音識(shí)別錯(cuò)誤的魯棒性。
2、對(duì)話目標(biāo)狀態(tài)跟蹤:根據(jù)持續(xù)多輪的對(duì)話來確定用戶當(dāng)前的目標(biāo)究竟是什么。跟蹤用戶狀態(tài),有助于在反復(fù)多輪的對(duì)話中,解決用戶的問題、提供產(chǎn)品解決方案。
3、對(duì)話策略:簡(jiǎn)單地說,就是系統(tǒng)要如何回應(yīng)用戶的話。這個(gè)策略包含了預(yù)期收益最大化的目標(biāo)。
4、語音合成:將對(duì)話策略輸出的語義,轉(zhuǎn)化成語音播報(bào)方式傳達(dá)給用戶(文字方式或短信,與之類似)。
對(duì)于任務(wù)驅(qū)動(dòng)式的多輪對(duì)話交互,有兩個(gè)很重要的指標(biāo):任務(wù)完成率和平均對(duì)話輪數(shù)。