歡迎大家來學(xué)習(xí)第三章的第三節(jié),梳理業(yè)務(wù)要素和知識庫。
首先,確定優(yōu)先級和關(guān)鍵信息要素。
以訂票為例,它的第一優(yōu)先級是訂票、退票、改簽和查詢,其次是各種規(guī)章制度等常見問題的解答,第三是天氣查詢,最后是簡答的問候和答謝。
基于以上提到的要點,先列出訂票相關(guān)的要素,有出發(fā)時間、出發(fā)站點、到達(dá)站點、火車類型、車次、以及座位信息;除此之外還有個人信息,包括姓名、手機(jī)號、身份證號、性別、會員等等;賬戶信息包括訂單,訂單的狀態(tài),代付款、未出行、賬戶余額、優(yōu)惠券和積分;票務(wù)的狀態(tài),如拍下待支付、拍下未支付等等。需要盡可能多而全的列出所有的關(guān)鍵信息。
其次,多維度展示狀態(tài)元素的信息。
例如,出發(fā)可以列出時間、地點、天氣;到達(dá)同樣有時間、地點、天氣等等。
因為機(jī)器人的對話實際上就是狀態(tài)到狀態(tài)之間轉(zhuǎn)換的有向圖。只有把所有的信息列的盡可能全,后續(xù)整個的訓(xùn)練流程,包括流程圖的繪制,才會更加的順暢,才能避免信息丟失。
最后,機(jī)器人任務(wù)要素梳理,即定義變量。
以訂機(jī)票為例,它的領(lǐng)域是訂機(jī)票,意圖是查詢飛機(jī)票,屬性(或稱詞槽)包括字段名稱、字段類型、取值示例和字段說明。比如說time字段,類型是DATETIME,取值可以有明天、后天等等,字段說明是時間;再比如from_geo字段,類型是GEO-INFO(即地理位置),取值可以是北京,字段說明是出發(fā)地;再包括from_airport出發(fā)機(jī)場字段等等,這些都是基礎(chǔ)變量信息。
建議讀者在實操時,先列出所有的狀態(tài)表,再依據(jù)狀態(tài)表,依據(jù)這些狀態(tài)元素去完成如上圖的任務(wù)要素梳理表。定義好每個字段信息、類型、示例和說明。是一個必不可少的準(zhǔn)備工作。
還需要說明一點,機(jī)器任務(wù)要素梳理時,即定義變量時如何處理一些更復(fù)雜的例子。
例如,早晨、早上、清晨,如何進(jìn)行參數(shù)化的定義。也就是說,當(dāng)用戶說早上時,代表著什么樣的數(shù)值,這是一個很難直接回答的問題,不同的情況也不一樣,所以可以有多種方式。
比如,可以把它定義成一個時間段,從6點到8點;或者定義早上就是7點;上午定義成8點到12點;再或者把上午定義成一個折中的10點。
同理,中午可以定義成11點到13點;或者定義成12點等等。
因此,在差旅場景中,如果用戶說要訂一張機(jī)票:“幫我訂一張早上去北京的”。具體落地時,早上參數(shù)化的表示,在具體場景是不一樣的。在此例當(dāng)中,根據(jù)如上的表格,可以將變量早上定義為6到8點。
如上,是一個相對更加復(fù)雜的變量定義的方法,希望讀者能夠把這些方法,靈活運用到聊天機(jī)器人梳理任務(wù)要素的環(huán)節(jié)當(dāng)中。
這就是這一節(jié)講的內(nèi)容,謝謝大家!