(譯)設(shè)計(jì)一個(gè)VUI——語音用戶界面

該文章為譯文,由于語音交互的資料不多,把自己能看到的中英文資料匯總下,以便自己和有需要的人學(xué)習(xí)。這篇文章主要講了如何設(shè)計(jì)智能語音設(shè)備中的用戶交互界面,理論性沒那么強(qiáng),很貼近實(shí)踐,可以參考借鑒。國(guó)外的文章,案例大多數(shù)都是蘋果、Amazon和Google的語音助手,學(xué)習(xí)方法論的同時(shí),還需深入思考,結(jié)合應(yīng)用場(chǎng)景和不同的語言文化進(jìn)行VUI設(shè)計(jì)。在學(xué)習(xí)文章的同時(shí),歡迎多多討論。原文鏈接如下

https://www.toptal.com/designers/ui/designing-a-vui

越來越多的語音控制設(shè)備,例如Apple HomePod,Google Home和Amazon Echo等正在席卷市場(chǎng)。語音用戶界面正在幫助改善各種不同的用戶體驗(yàn),有人認(rèn)為,到了2020年,語音將為搜索提供50%的動(dòng)力。

啟用語音的AI可以即時(shí)處理幾乎所有的事情。

“我接下來的日程安排是什么?”

“幫我預(yù)訂去牛津街的出租車?!?/p>

“使用Spotify播放爵士樂!”

微軟、谷歌、亞馬遜,蘋果和Facebook這五大巨頭科技公司均已開發(fā)或正在優(yōu)化具有語音功能的人工智能助手。 Siri是Apple iOS和HomePod設(shè)備的AI助手,每月幫助超過4000萬用戶完成各類事項(xiàng),據(jù)ComScore稱,如今,美國(guó)十分之一的家庭已經(jīng)擁有智能語音揚(yáng)聲器。

無論我們是在談?wù)撚糜谝苿?dòng)應(yīng)用程序還是用于智能家居揚(yáng)聲器的VUI(語音用戶界面),語音交互在當(dāng)今的技術(shù)中都變得越來越普遍,尤其當(dāng)人們對(duì)屏幕產(chǎn)生疲勞的時(shí)候。

Echo Spot不同于Echo Show,它是亞馬遜的最新款智能語音設(shè)備,同時(shí)包含了語音和圖形界面


用戶可以使用語音命令做什么?

Alexa是支持語音功能的亞馬遜設(shè)備(例如Echo智能揚(yáng)聲器和Kindle Fire平板電腦)的AI助手,亞馬遜目前在語音技術(shù)(銷售方面)領(lǐng)域處于領(lǐng)先地位。

在Alexa商店中,一些最時(shí)尚的應(yīng)用程序(稱為“技能”)專注于娛樂,翻譯和新聞,盡管用戶還可以執(zhí)行諸如通過Uber請(qǐng)求出行,通過Spotify播放音樂或甚至通過達(dá)美樂訂購比薩。

另一個(gè)有趣的例子來自商業(yè)銀行Capital One,該銀行于2016年引入了Alexa,并且是第一家這樣做的銀行。通過Alexa添加Capital One應(yīng)用,客戶可以檢查其余額和到期日,甚至還清信用卡賬單。 PayPal通過允許用戶在iOS或Apple HomePod上通過Siri進(jìn)行付款使這一概念更進(jìn)一步,并且PayPal的Alexa技能也可以做到這一點(diǎn)。

但是,「VUI可以做什么」和「用戶實(shí)際使用它們做什么」是兩件事。

ComScore表示,擁有智能揚(yáng)聲器的用戶中,超過一半的用戶使用其設(shè)備來詢問一般的問題,查看天氣和播放音樂,然后用戶指令最多的是設(shè)定鬧鐘、待辦事項(xiàng)和日歷提醒(請(qǐng)注意,這些任務(wù)相當(dāng)基本)。

你可以發(fā)現(xiàn),其中許多任務(wù)都包括問問題(例如,語音搜索)。

那么用戶會(huì)使用語音搜索些什么呢?

當(dāng)人們開車的時(shí)候,他們會(huì)使用語音搜索,當(dāng)用戶不能觸摸屏幕的場(chǎng)景下(比如做飯、健身或是在工作時(shí)需要處理多個(gè)任務(wù)時(shí)),可以觸發(fā)語音交互。

因?yàn)橛辛薌oogle Assistant和Android Auto,查看實(shí)時(shí)的交通路況更新變得特別容易

語音用戶界面用戶研究

雖然了解到用戶使用語音的普遍程度,但對(duì)于UX設(shè)計(jì)人員來說,對(duì)他們自己正在設(shè)計(jì)的VUI應(yīng)用進(jìn)行用戶研究很重要。


用戶旅程圖

用戶研究是通過觀察和反饋了解用戶的需求、行為和動(dòng)機(jī)。以語音為渠道的用戶旅程圖不僅僅幫助了用戶研究員去定義不同級(jí)別用戶的不同需求,也幫助了他們確認(rèn)語音交互會(huì)如何或是在哪種場(chǎng)景下被觸發(fā)。

在尚未創(chuàng)建客戶旅程圖的情況下,設(shè)計(jì)師應(yīng)突出顯示語音交互將在用戶流程中出現(xiàn)的位置(可以突出顯示為機(jī)會(huì),渠道或接觸點(diǎn))。如果已經(jīng)有了該企業(yè)的客戶旅程圖,那么設(shè)計(jì)人員應(yīng)查看是否可以通過語音交互來改善用戶流程。

比如,當(dāng)用戶總是通過社交媒體或是實(shí)時(shí)聊天系統(tǒng)問某一重復(fù)的問題,那么也許可以將其整合到語音App中。

總而言之,設(shè)計(jì)是為了解決問題,用戶在用戶旅程圖中會(huì)遇到什么困難和障礙?


VUI競(jìng)品分析

通過競(jìng)品分析,設(shè)計(jì)師可以找出競(jìng)品將語音交互界面執(zhí)行落地的方式。你需要帶著以下問題是做競(jìng)品分析:

他們的應(yīng)用程序的用戶用例是什么?

他們使用語音執(zhí)行哪些指令?

用戶是如何評(píng)價(jià)這些app的,我們可以從中學(xué)到什么?


收集需求

為了設(shè)計(jì)語音交互界面,我們首先需要定義用戶需求。除了要?jiǎng)?chuàng)建用戶旅行圖、進(jìn)行競(jìng)品分析之外,其他的研究方式比如用戶訪談和用戶測(cè)試也會(huì)很有幫助。

對(duì)于VUI設(shè)計(jì),這些書面要求尤為重要,因?yàn)樗鼈兒w了開發(fā)人員的大多數(shù)設(shè)計(jì)規(guī)范。第一步是捕獲不同的場(chǎng)景,然后將其轉(zhuǎn)變?yōu)橛脩艉驼Z音助手之間的對(duì)話流。

舉一個(gè)新聞App的用戶故事的例子:

“作為用戶,我希望語音助手閱讀最新新聞,這樣我無需查看屏幕即可了解最新情況”

有了這樣的用戶故事,我們可以為其設(shè)計(jì)對(duì)話流程。

語音指令拆解

在創(chuàng)建對(duì)話流程之前,設(shè)計(jì)人員首先需要了解語音命令的結(jié)構(gòu)。在設(shè)計(jì)VUI時(shí),設(shè)計(jì)師經(jīng)常需要考慮語音交互的目標(biāo)是什么(在這種情況下用戶想要完成什么?)

用戶指令包括三個(gè)關(guān)鍵因素:意圖、表達(dá)和詞槽。

?讓我們分析以下請(qǐng)求:“使用Spotify播放輕音樂?!?/p>

意圖(語音交互的目標(biāo))

意圖代表了更廣的用戶語音指令,它可以是確定意圖或是模糊意圖。

確定意圖是執(zhí)行并完成一個(gè)確定任務(wù),比如打開或者關(guān)閉客廳的燈,或是把熱水器調(diào)到一個(gè)特定的溫度。設(shè)計(jì)這些指令的時(shí)候非常直接,因?yàn)橛脩魧?duì)智能語音助手的期待非常清晰。

模糊意圖更加模糊,通常也更難解析。比如,如果用戶想要再聽一次阿姆斯特丹(hear more about Amsterdam),我們需要檢查意圖是否包含在服務(wù)范圍里,然后問用戶更多的問題去了解用戶的要求。(hear more about Amsterdam也可以是了解更多關(guān)于阿姆斯特丹的信息的意思,因此意圖是模糊的、有歧義的)

上述的例子中,用戶真正的意圖是:用戶想要聽音樂。

表達(dá)(用戶如何遣詞造句發(fā)出指令)

表達(dá)反映了用戶如何表達(dá)他們的請(qǐng)求。在給定的示例中,我們知道用戶希望通過說“ Play me…”在Spotify上播放音樂,但這并不是用戶發(fā)出此請(qǐng)求的唯一方式。例如,用戶還可以說:“我想聽音樂...?!?/p>

設(shè)計(jì)師需要考慮到各種表達(dá)方式的變體,進(jìn)行用戶問法擴(kuò)充,這將幫助AI引擎識(shí)別請(qǐng)求并將其連接到正確的操作或響應(yīng)。

詞槽

有時(shí)只有一個(gè)意圖是不夠的,我們需要用戶提供更多的信息才能完成指令。Alexa稱這些信息為“詞槽”,“詞槽”就像傳統(tǒng)表單一樣,它可以是選填或是必填的,取決于需要哪些去完成指令。

我們的案例中,詞槽是“放松的”,但是設(shè)備不需要它也可以完成用戶的指令,所以這個(gè)詞槽是可選的。然而,在用戶想要叫車出行的時(shí)候,關(guān)鍵的詞槽是「目的地」,而且它是必填詞槽??蛇x輸入將覆蓋任何默認(rèn)值,例如,一位用戶要求出租車「下午四點(diǎn)」到達(dá)將覆蓋默認(rèn)值「盡快」到達(dá)。


使用對(duì)話流制作語音交互原型

語音交互設(shè)計(jì)師需要像編劇一樣思考、為每一個(gè)需求設(shè)計(jì)對(duì)話。對(duì)話是可交付的,概述了以下內(nèi)容:

觸發(fā)交互的關(guān)鍵詞;

代表對(duì)話可能會(huì)導(dǎo)致的分支;

用戶和語音助手之間的示例對(duì)話;

對(duì)話流腳本說明了用戶和語音助手之間一去一回的對(duì)話。對(duì)話流就像圖形界面設(shè)計(jì)中的原型圖,它可以被描繪成一個(gè)圖解(就像下面這個(gè)例子),有的原型應(yīng)用可以用來創(chuàng)建對(duì)話流。

一個(gè)闡明了意圖、詞槽和整體對(duì)話的示例對(duì)話

制作VUI原型的應(yīng)用

一旦你撰寫好對(duì)話流,你就可以使用app制作語音交互原型了。市場(chǎng)上已經(jīng)有了一些制作語音交互原型的工具,比如,Sayspring這款軟件幫助了設(shè)計(jì)師為亞馬遜和谷歌應(yīng)用創(chuàng)建了有效的語音原型。

Sayspring是一款可輕松實(shí)現(xiàn)Alexa技能或Google Home Action原型制作的工具


亞馬遜還提供了自己的Alexa Skill Builder,使設(shè)計(jì)師可以輕松創(chuàng)建新的Alexa Skills。 Google提供了一個(gè)SDK;但是,這是針對(duì)Google Action開發(fā)人員的。 Apple尚未啟動(dòng)其競(jìng)爭(zhēng)工具,但很快他們將啟動(dòng)SiriKit。

亞馬遜的Alexa Skill Builder,設(shè)計(jì)人員可以在其中為支持Alexa的設(shè)備制作VUI原型


語音應(yīng)用的UX分析

一旦你賦予了Alexa新的技能,你可以追蹤應(yīng)用和分析一起使用。亞馬遜和谷歌提供了一個(gè)內(nèi)置的分析工具;你也可以為了更縝密的分析整合第三方服務(wù)。(比如亞馬遜Alexa的voicelabs.co,或是谷歌助手的dashbot.io)。需要注意的關(guān)鍵指標(biāo)有:

參與度指標(biāo),每個(gè)用戶的會(huì)話數(shù)量或是每個(gè)會(huì)話的消息數(shù)量;

使用的語言:

行為流;

消息、意圖和表達(dá)


VUI設(shè)計(jì)實(shí)用技巧

在設(shè)計(jì)移動(dòng)應(yīng)用和網(wǎng)站時(shí),設(shè)計(jì)人員必須思考哪些是主要信息,哪些是次要信息(不那么重要)。用戶不應(yīng)接收過多的無用信息,但與此同時(shí),他們又需要足夠的信息來完成任務(wù)。 對(duì)于語音來說,設(shè)計(jì)師必須更加小心因?yàn)樗性~匯(可能是一個(gè)相對(duì)簡(jiǎn)單的GUI)都可以與之溝通。在傳送復(fù)雜信息和數(shù)據(jù)的情況下,這尤其困難。這意味著用更少的詞會(huì)更好,并且設(shè)計(jì)師需要確保該應(yīng)用程序能夠滿足用戶的目標(biāo)并保持嚴(yán)格的對(duì)話狀態(tài)。


確認(rèn)任務(wù)何時(shí)完成

在設(shè)計(jì)電子商務(wù)結(jié)帳流程時(shí),關(guān)鍵屏幕之一是最終確認(rèn)界面。這使客戶知道交易已被成功記錄。

同樣的概念也適用于語音交互設(shè)計(jì)。比如,當(dāng)一位用戶在客廳要求語音助理關(guān)掉衛(wèi)生間的燈時(shí),如果沒有確認(rèn),他們就會(huì)走進(jìn)客廳并檢查,使語音應(yīng)用程序徹底失去能為用戶解放雙手的目標(biāo)。

在這種情況下,“廁所燈已關(guān)”的回復(fù)就很好。

創(chuàng)建一個(gè)強(qiáng)有力的錯(cuò)誤策略

作為一個(gè)VUI設(shè)計(jì)師,設(shè)計(jì)一套強(qiáng)有力的錯(cuò)誤策略很重要。始終針對(duì)語音助手根本聽不懂或聽不到任何聲音的場(chǎng)景設(shè)計(jì)一定的反饋或回復(fù)。分析還可以用于識(shí)別錯(cuò)誤的順序和誤解,從而可以改善錯(cuò)誤策略。

當(dāng)檢查替代對(duì)話的時(shí)候你需要問下面幾個(gè)關(guān)鍵問題:

你是否識(shí)別了交互的意圖?

AI是否可以解析用戶的信息?

AI是否需要來自用戶的更多信息以便更好地完成用戶的指令?

我們能否交付用戶要求的東西?

添加額外的安全性

谷歌助手、Siri和Alexa現(xiàn)在可以識(shí)別每一個(gè)不同的聲音,這為用戶增加了安全性。與面部和指紋識(shí)別ID相似,語音識(shí)別軟件正在不斷提高,模仿聲音已經(jīng)越來越難;然而,在現(xiàn)在這個(gè)時(shí)候,它也許還不夠安全,添加授權(quán)就非常必要。當(dāng)處理敏感數(shù)據(jù)時(shí),設(shè)計(jì)師可能需要設(shè)計(jì)一個(gè)額外的身份驗(yàn)證步驟,例如指紋,密碼或面部識(shí)別。在個(gè)人消息傳遞和付款的情況下這個(gè)步驟顯得尤為重要。

百度的語音助手小度已在肯德基的多家餐館中使用,并使用面部識(shí)別功能根據(jù)年齡和歷史訂單提出用餐建議。


VUI革命的曙光

VUI現(xiàn)如今興起,并在接下來幾年會(huì)被應(yīng)用到越來越多的產(chǎn)品的中。有人預(yù)測(cè)未來十年我們不會(huì)再使用鍵盤與計(jì)算機(jī)交互。

當(dāng)我們思考用戶體驗(yàn)時(shí),我們依舊傾向于看到或者觸摸到的。因此,語音作為一種交互方式很少被想到。然而,在設(shè)計(jì)用戶體驗(yàn)界面時(shí)語音和視覺并不是互斥的——它們都可以為產(chǎn)品增添價(jià)值。

用戶研究需要回答語音是否可以提升用戶體驗(yàn),并且考慮到支持語音的設(shè)備的市場(chǎng)份額增長(zhǎng)的速度有多快,這個(gè)研究很值得花時(shí)間,因?yàn)樗梢詭椭嵘齛pp的價(jià)值和質(zhì)量。


了解基礎(chǔ)

什么是可觸摸的用戶界面?

一個(gè)可觸摸的用戶界面可以通過點(diǎn)擊、輕掃等手勢(shì)與設(shè)備發(fā)生交互??捎|摸的用戶界面通常在觸摸屏上顯示。

什么是語音界面?

語音交互界面是無形的界面需要語音與其進(jìn)行交互。具有語音識(shí)別軟件的常見設(shè)備是Amazon Alexa智能揚(yáng)聲器。

Echo是做什么的?

亞馬遜的Echo智能揚(yáng)聲器使用語音識(shí)別軟件幫助用戶使用語音交互完成任務(wù),即使用戶和Echo在不同的房間。Echo智能揚(yáng)聲器受到了語音助手Alex和被稱作“技能”的VUI app的助力。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容