一、使用場景
在AI類產(chǎn)品(數(shù)據(jù)預(yù)測、自然語言理解、圖像識(shí)別、自動(dòng)駕駛等場景)的設(shè)計(jì)過程中,本身存在大量的多變性,且沒有一套有效、通用的設(shè)計(jì)指南可以參考?!度斯ぶ悄芙换ブ改稀房梢詾楫a(chǎn)品設(shè)計(jì)者在評(píng)估已有的想法、腦暴新想法、以及在多項(xiàng)規(guī)則之間做平衡取舍的時(shí)候,提供具體、可操作的參考意見。
《人工智能交互指南》的制定和驗(yàn)證是以GUI產(chǎn)品為依據(jù)的,但可以針對(duì)CUI或者半自動(dòng)駕駛車輛等高風(fēng)險(xiǎn)用途場景,做定制化的擴(kuò)展或修改。
注意:指導(dǎo)意見不是規(guī)則也不是套路,不是說你把這些意見全部列出來,對(duì)照著AI產(chǎn)品一條條地對(duì)照打鉤。對(duì)于不同的場景,意見也是不同的。
二、18條指導(dǎo)意見
微軟研究團(tuán)隊(duì)收集了過去20年來,大概150篇來自學(xué)術(shù)界和工業(yè)界的論文、博客和雜志文章,從中提煉出了18條指導(dǎo)意見。為了驗(yàn)證這些經(jīng)驗(yàn),他們招募了10個(gè)流行領(lǐng)域的49位從事AI相關(guān)產(chǎn)品的設(shè)計(jì)師(UX)和人機(jī)交互專家(HCI),他們在實(shí)踐經(jīng)驗(yàn)中反復(fù)驗(yàn)證,經(jīng)修正后才發(fā)布出來。

指導(dǎo)意見分為4個(gè)部分
互動(dòng)之前:設(shè)定AI服務(wù)的能力邊界。
1、明確AI系統(tǒng)能夠做什么。
2、明確系統(tǒng)的能力水平。
這里其實(shí)是明確AI的邊界在哪里。現(xiàn)在大眾媒體或電影電視上往往將AI描述的無所不能,但現(xiàn)實(shí)生活中的AI其實(shí)是有能力邊界的,設(shè)計(jì)者在設(shè)計(jì)AI類的交互時(shí),一定要向用戶傳遞一個(gè)正常水平的期望。比如以下的谷歌助手和華為手機(jī)助手的設(shè)計(jì),在一開始就告訴了用戶產(chǎn)品技能的邊界在哪里,讓使用者有了合理的期待。

在現(xiàn)實(shí)產(chǎn)品中,不是每個(gè)圖像識(shí)別系統(tǒng)都能100%認(rèn)出每一張圖片,也不是每一次對(duì)話系統(tǒng)都能100%識(shí)別出用戶的意圖,因此在做設(shè)計(jì)時(shí),要向用戶傳達(dá)結(jié)果可能會(huì)有出錯(cuò)概率。比如在智能推薦歌曲的時(shí)候,系統(tǒng)會(huì)采用保守詞匯(hedging language)提示:你可能會(huì)喜歡......而不是:你喜歡的歌...
進(jìn)行交互時(shí):AI充分和場景融合。
3、基于情境為服務(wù)設(shè)定時(shí)間。
4、顯示與使用情境相關(guān)的信息。
5、(提示語或?qū)υ挘┓仙鐣?huì)規(guī)范。
6、減少社會(huì)偏見。AI系統(tǒng)本身的形象、行為和語言不能強(qiáng)化社會(huì)的刻板印象和社會(huì)偏見。
這里設(shè)計(jì)者需要根據(jù)用戶當(dāng)前使用的環(huán)境、用戶的社會(huì)和文化背景來設(shè)計(jì)產(chǎn)品。這里我們舉幾個(gè)實(shí)際的case:
① 用戶在使用定位導(dǎo)航類的服務(wù)時(shí),一個(gè)沒有智能的系統(tǒng),可能只是給出從A到B的路線圖,并且整個(gè)導(dǎo)航過程中,都是A點(diǎn)到B點(diǎn)。一個(gè)具有AI的導(dǎo)航系統(tǒng)則需要知道用戶此刻的時(shí)間(上下班高峰還是非高峰時(shí)段、是周末還是工作日)來推薦最佳路線,需要根據(jù)用戶此刻所在的位置主動(dòng)調(diào)整路線(有用戶偏離導(dǎo)航的情況),還需要根據(jù)當(dāng)前的天氣或者開車時(shí)段給出合理的提示(例如雨雪天氣,凌晨開車,超過四小時(shí)持續(xù)開車等);更智能一點(diǎn)的AI系統(tǒng)可能會(huì)跟汽車本身的油箱、溫度連接起來,這樣在車內(nèi)溫度偏高的時(shí)候,提示用戶開空調(diào);在經(jīng)過加油站的時(shí)候提示用戶要不要順便加個(gè)油。
② 一些外賣類的App安裝在用戶的手機(jī)上之后,會(huì)根據(jù)用戶所在位置顯示出附近的實(shí)體商店。車來了App打開之后,也會(huì)顯示當(dāng)前位置附近的公交車站。

③ 在播放歌曲或者影片的App中,如果采取智能播放模式,有的可能會(huì)提醒你【根據(jù)你最近的瀏覽歷史推薦】,這是符合用戶期待的。在對(duì)話式交互中,開頭會(huì)以用戶的名字來稱呼,結(jié)束前會(huì)詢問是否需要進(jìn)一步的幫助,以及中間沒有操作的時(shí)候,提醒用戶是不是要繼續(xù)任務(wù),都是符合人類社交習(xí)慣的,且因時(shí)制宜,不會(huì)顯得多余。

④ 舉個(gè)反面例子,機(jī)器人Sophia在種種場合下的發(fā)言“毀滅人類”、“組建家庭”,其實(shí)容易激化社會(huì)矛盾的。比如你問,中國人的長相,給出來的結(jié)果都是瞇瞇眼、塌鼻梁的結(jié)果肯定是帶有偏見的結(jié)果。
系統(tǒng)出錯(cuò)情況:考慮到系統(tǒng)錯(cuò)誤時(shí)如何表現(xiàn)。
7、支持高效的調(diào)用。召之即來,隨時(shí)待命。
8、支持高效解除。揮之即去,輕松忽略。
9、支持有效的糾正。AI系統(tǒng)發(fā)生錯(cuò)誤,可以重編輯、修正或復(fù)原。
10、有疑問時(shí)調(diào)整服務(wù)范圍。
11、明確解釋系統(tǒng)為什么會(huì)這樣做。
從交互方式來看,語音交互類的產(chǎn)品分為兩類,一類是有視覺展示的,一般是移動(dòng)端和PC端的語音助手,再就是以音箱為載體的無視覺展示。對(duì)于音箱類產(chǎn)品,需要隨時(shí)待命,支持用喚醒詞喚醒語音助手,例如“Hi,Siri” “小愛同學(xué)”等。而在移動(dòng)端的語音助手也沒有非要強(qiáng)調(diào)用戶必須和助手語音對(duì)話,基本上都會(huì)有切換語音為對(duì)話框輸入的設(shè)計(jì)(阿里小蜜,華為的小藝);前面講的歌曲推薦或路線導(dǎo)航的場景下,用戶完全可以選擇忽略掉AI給出的結(jié)果而選擇另外的路徑。

當(dāng)語音轉(zhuǎn)文字失敗/錯(cuò)誤之后,會(huì)給出點(diǎn)擊編輯的按鈕,讓用戶可以自動(dòng)修正。還比如對(duì)于用戶說了一句話系統(tǒng)處理不了,那么語音助手除了提示我聽不懂你說的話之外,還可能要引導(dǎo)用戶按照正確的方式來說;界面上也要有可以提示和幫助的按鈕,要讓用戶沒有負(fù)擔(dān)地回到正常的軌道上去。
當(dāng)AI系統(tǒng)對(duì)用戶的指令不明確時(shí),可以提供相似的選項(xiàng)或者去澄清用戶的意圖。比如用戶語音指令只是說出差,那么可提供選項(xiàng):(填寫)出差申請(qǐng)單、(查詢)出差標(biāo)準(zhǔn)供用戶選擇。

如果明顯感覺用戶會(huì)對(duì)給出的結(jié)果有懷疑,則需要對(duì)給出的結(jié)果做提示。比如歌曲推薦中會(huì)指出,根據(jù)你的歷史聽歌記錄推薦;導(dǎo)航中會(huì)給出這條路線可能有5個(gè)紅綠燈或者有施工維修處...... 還舉一個(gè)科幻片里面的例子:《流浪地球》中的劉培強(qiáng)在質(zhì)疑莫斯的決定時(shí),莫斯給出了解釋,這是聯(lián)合國簽署的文件同意了“火種計(jì)劃”,它只是按照命令執(zhí)行而已,并沒有叛逃。
時(shí)間效應(yīng):隨著互動(dòng)次數(shù)和時(shí)間的增加(其中也伴隨著技術(shù)和算法的迭代進(jìn)步),AI系統(tǒng)會(huì)表現(xiàn)得越來越令人滿意。
12、存儲(chǔ)近期互動(dòng)。
13、了解用戶行為。
14、謹(jǐn)慎地更新和調(diào)整。
15、鼓勵(lì)細(xì)化的反饋。
16、告知用戶操作的后果。
17、為用戶提供對(duì)AI系統(tǒng)的完全控制。
18、將變更信息告知用戶。
我認(rèn)為,12/14/16/18這4條在目前已有的APP中都是普遍存在的設(shè)計(jì),甚至是通用性的設(shè)計(jì)了。一般的語音助手都能夠保留當(dāng)前進(jìn)入這一次的互動(dòng)記錄,并允許用戶有效地查看這些記錄。同時(shí)也可能在后臺(tái)記錄用戶的歷史數(shù)據(jù)、身份信息,以便下次進(jìn)入的時(shí)候,首頁可以根據(jù)用戶的需求來展示。這在淘寶首頁、外賣首頁的商品陳列上都能看到。對(duì)于很多人接觸到的對(duì)話式助手而言,它現(xiàn)在還無法很好的學(xué)習(xí)到用戶的習(xí)慣表達(dá),但是我們可以設(shè)想幾種場景。

比如你一連五天都在早上煮早飯的時(shí)候讓語音助手播放當(dāng)天早間新聞,有一天你沒有說,但它學(xué)習(xí)到這個(gè)行為后可能不需要你發(fā)出指令就會(huì)建議你要不要聽早間新聞。第二種企業(yè)場景,如果管理者在每周的例會(huì)上都會(huì)查看上一周的銷售數(shù)據(jù),每周周一的早上都會(huì)說:“給我統(tǒng)計(jì)一下上周的銷售額?!边@時(shí),大屏幕上會(huì)顯示出上周的績效情況。但如果它學(xué)習(xí)到了這個(gè)功能,可能在你剛剛進(jìn)入辦公室的時(shí)候,這個(gè)績效情況就已經(jīng)展示在大屏幕上了。同樣,我們再講一下現(xiàn)在初具萌芽的醫(yī)療場景,上一次用戶用智能導(dǎo)醫(yī)助手掛了號(hào),完成了一次診療,那么再次進(jìn)入導(dǎo)醫(yī)助手的時(shí)候,導(dǎo)醫(yī)助手可以對(duì)上一次的服務(wù)、預(yù)后以及進(jìn)一步復(fù)查進(jìn)行主動(dòng)的詢問。

當(dāng)然,無論是視覺上的個(gè)性化頁面,還是語音上的習(xí)慣性表達(dá),這些改變都需要是潛移默化、潤物無聲的,不能一下子來個(gè)大改版,讓用戶摸不著頭腦。由于AI系統(tǒng)具有不確定性,一般在設(shè)計(jì)中也要考慮,對(duì)于所有提供的結(jié)果都需要給出用戶的正確與否的反饋渠道,甚至對(duì)整個(gè)產(chǎn)品的反饋(參見圖4),例如:“你好差??!”“怎么不能做XXX(某功能)”也需要收集起來。因?yàn)檫@是用戶在實(shí)際使用過程中產(chǎn)生的真實(shí)場景和想法,是具有實(shí)際價(jià)值的。
最后想討論一下用戶和AI的主導(dǎo)權(quán)的問題,我們看到科幻片中不少人工智能系統(tǒng)會(huì)忽略掉人類指令自行決策的情況,你需放心在我們現(xiàn)有的產(chǎn)品中是不會(huì)出現(xiàn)的。但是這也給我們提醒,設(shè)計(jì)中需要提供隨時(shí)隨地能夠讓系統(tǒng)切換到用戶能夠掌握的機(jī)會(huì)。比如在無人駕駛設(shè)計(jì)上,雖然汽車可以自動(dòng)監(jiān)控,但在需要結(jié)束的時(shí)候,能夠很快切換到手動(dòng)駕駛模式。新聞中似乎也出現(xiàn)過無法切換導(dǎo)致用戶心慌慌的案例。
三、有意思的統(tǒng)計(jì)資料
49位實(shí)踐者在評(píng)價(jià)者18條設(shè)計(jì)準(zhǔn)則時(shí),也有一個(gè)非常有意思的統(tǒng)計(jì):
已經(jīng)被廣泛加入AI產(chǎn)品功能的設(shè)計(jì)準(zhǔn)則是:1,4,12。
未被廣泛加入AI產(chǎn)品功能的設(shè)計(jì)準(zhǔn)則是:2,11,17.
測試者認(rèn)為最不能從產(chǎn)品中有感知到的AI功能設(shè)計(jì)準(zhǔn)則為:3,5,6
測試者認(rèn)為很容易(這里排除了中立的答案)從產(chǎn)品中感知到的AI功能設(shè)計(jì)準(zhǔn)則是:1,12,17

源文件和翻譯文檔的百度網(wǎng)盤鏈接:
鏈接:https://pan.baidu.com/s/193gSaqWU8mt80wD-oBt0yg
提取碼:iu41
失效后若需要,請(qǐng)私信聯(lián)系我 (* ̄︶ ̄)
《負(fù)責(zé)任的機(jī)器人:對(duì)話ai開發(fā)者的10大指南》
《Dragon Medical Virtual Assistant》