該文章為譯文，由于語音交互的資料不多，把自己能看到的中英文資料匯總下，以便自己和有需要的人學(xué)習(xí)。這篇文章主要講了如何設(shè)計(jì)智能語音設(shè)備中的用戶交互界面，理論性沒那么強(qiáng)，很貼近實(shí)踐，可以參考借鑒。國(guó)外的文章，案例大多數(shù)都是蘋果、Amazon和Google的語音助手，學(xué)習(xí)方法論的同時(shí)，還需深入思考，結(jié)合應(yīng)用場(chǎng)景和不同的語言文化進(jìn)行VUI設(shè)計(jì)。在學(xué)習(xí)文章的同時(shí)，歡迎多多討論。原文鏈接如下

https://www.toptal.com/designers/ui/designing-a-vui

越來越多的語音控制設(shè)備，例如Apple HomePod，Google Home和Amazon Echo等正在席卷市場(chǎng)。語音用戶界面正在幫助改善各種不同的用戶體驗(yàn)，有人認(rèn)為，到了2020年，語音將為搜索提供50％的動(dòng)力。

啟用語音的AI可以即時(shí)處理幾乎所有的事情。

“我接下來的日程安排是什么？”

“幫我預(yù)訂去牛津街的出租車?！?/p>

“使用Spotify播放爵士樂！”

微軟、谷歌、亞馬遜，蘋果和Facebook這五大巨頭科技公司均已開發(fā)或正在優(yōu)化具有語音功能的人工智能助手。 Siri是Apple iOS和HomePod設(shè)備的AI助手，每月幫助超過4000萬用戶完成各類事項(xiàng)，據(jù)ComScore稱，如今，美國(guó)十分之一的家庭已經(jīng)擁有智能語音揚(yáng)聲器。

無論我們是在談?wù)撚糜谝苿?dòng)應(yīng)用程序還是用于智能家居揚(yáng)聲器的VUI（語音用戶界面），語音交互在當(dāng)今的技術(shù)中都變得越來越普遍，尤其當(dāng)人們對(duì)屏幕產(chǎn)生疲勞的時(shí)候。

Echo Spot不同于Echo Show，它是亞馬遜的最新款智能語音設(shè)備，同時(shí)包含了語音和圖形界面

用戶可以使用語音命令做什么？

Alexa是支持語音功能的亞馬遜設(shè)備（例如Echo智能揚(yáng)聲器和Kindle Fire平板電腦）的AI助手，亞馬遜目前在語音技術(shù)（銷售方面）領(lǐng)域處于領(lǐng)先地位。

在Alexa商店中，一些最時(shí)尚的應(yīng)用程序（稱為“技能”）專注于娛樂，翻譯和新聞，盡管用戶還可以執(zhí)行諸如通過Uber請(qǐng)求出行，通過Spotify播放音樂或甚至通過達(dá)美樂訂購比薩。

另一個(gè)有趣的例子來自商業(yè)銀行Capital One，該銀行于2016年引入了Alexa，并且是第一家這樣做的銀行。通過Alexa添加Capital One應(yīng)用，客戶可以檢查其余額和到期日，甚至還清信用卡賬單。 PayPal通過允許用戶在iOS或Apple HomePod上通過Siri進(jìn)行付款使這一概念更進(jìn)一步，并且PayPal的Alexa技能也可以做到這一點(diǎn)。

但是，「VUI可以做什么」和「用戶實(shí)際使用它們做什么」是兩件事。

ComScore表示，擁有智能揚(yáng)聲器的用戶中，超過一半的用戶使用其設(shè)備來詢問一般的問題，查看天氣和播放音樂，然后用戶指令最多的是設(shè)定鬧鐘、待辦事項(xiàng)和日歷提醒（請(qǐng)注意，這些任務(wù)相當(dāng)基本）。

你可以發(fā)現(xiàn)，其中許多任務(wù)都包括問問題（例如，語音搜索）。

那么用戶會(huì)使用語音搜索些什么呢？

當(dāng)人們開車的時(shí)候，他們會(huì)使用語音搜索，當(dāng)用戶不能觸摸屏幕的場(chǎng)景下（比如做飯、健身或是在工作時(shí)需要處理多個(gè)任務(wù)時(shí)），可以觸發(fā)語音交互。

因?yàn)橛辛薌oogle Assistant和Android Auto，查看實(shí)時(shí)的交通路況更新變得特別容易

語音用戶界面用戶研究

雖然了解到用戶使用語音的普遍程度，但對(duì)于UX設(shè)計(jì)人員來說，對(duì)他們自己正在設(shè)計(jì)的VUI應(yīng)用進(jìn)行用戶研究很重要。

用戶旅程圖

用戶研究是通過觀察和反饋了解用戶的需求、行為和動(dòng)機(jī)。以語音為渠道的用戶旅程圖不僅僅幫助了用戶研究員去定義不同級(jí)別用戶的不同需求，也幫助了他們確認(rèn)語音交互會(huì)如何或是在哪種場(chǎng)景下被觸發(fā)。

在尚未創(chuàng)建客戶旅程圖的情況下，設(shè)計(jì)師應(yīng)突出顯示語音交互將在用戶流程中出現(xiàn)的位置（可以突出顯示為機(jī)會(huì)，渠道或接觸點(diǎn)）。如果已經(jīng)有了該企業(yè)的客戶旅程圖，那么設(shè)計(jì)人員應(yīng)查看是否可以通過語音交互來改善用戶流程。

比如，當(dāng)用戶總是通過社交媒體或是實(shí)時(shí)聊天系統(tǒng)問某一重復(fù)的問題，那么也許可以將其整合到語音App中。

總而言之，設(shè)計(jì)是為了解決問題，用戶在用戶旅程圖中會(huì)遇到什么困難和障礙？

VUI競(jìng)品分析

通過競(jìng)品分析，設(shè)計(jì)師可以找出競(jìng)品將語音交互界面執(zhí)行落地的方式。你需要帶著以下問題是做競(jìng)品分析：

他們的應(yīng)用程序的用戶用例是什么？

他們使用語音執(zhí)行哪些指令？

用戶是如何評(píng)價(jià)這些app的，我們可以從中學(xué)到什么？

收集需求

為了設(shè)計(jì)語音交互界面，我們首先需要定義用戶需求。除了要?jiǎng)?chuàng)建用戶旅行圖、進(jìn)行競(jìng)品分析之外，其他的研究方式比如用戶訪談和用戶測(cè)試也會(huì)很有幫助。

對(duì)于VUI設(shè)計(jì)，這些書面要求尤為重要，因?yàn)樗鼈兒w了開發(fā)人員的大多數(shù)設(shè)計(jì)規(guī)范。第一步是捕獲不同的場(chǎng)景，然后將其轉(zhuǎn)變?yōu)橛脩艉驼Z音助手之間的對(duì)話流。

舉一個(gè)新聞App的用戶故事的例子：

“作為用戶，我希望語音助手閱讀最新新聞，這樣我無需查看屏幕即可了解最新情況”

有了這樣的用戶故事，我們可以為其設(shè)計(jì)對(duì)話流程。

語音指令拆解

在創(chuàng)建對(duì)話流程之前，設(shè)計(jì)人員首先需要了解語音命令的結(jié)構(gòu)。在設(shè)計(jì)VUI時(shí)，設(shè)計(jì)師經(jīng)常需要考慮語音交互的目標(biāo)是什么（在這種情況下用戶想要完成什么？）

用戶指令包括三個(gè)關(guān)鍵因素：意圖、表達(dá)和詞槽。

?讓我們分析以下請(qǐng)求：“使用Spotify播放輕音樂?！?/p>

意圖（語音交互的目標(biāo)）

意圖代表了更廣的用戶語音指令，它可以是確定意圖或是模糊意圖。

確定意圖是執(zhí)行并完成一個(gè)確定任務(wù)，比如打開或者關(guān)閉客廳的燈，或是把熱水器調(diào)到一個(gè)特定的溫度。設(shè)計(jì)這些指令的時(shí)候非常直接，因?yàn)橛脩魧?duì)智能語音助手的期待非常清晰。

模糊意圖更加模糊，通常也更難解析。比如，如果用戶想要再聽一次阿姆斯特丹（hear more about Amsterdam)，我們需要檢查意圖是否包含在服務(wù)范圍里，然后問用戶更多的問題去了解用戶的要求。（hear more about Amsterdam也可以是了解更多關(guān)于阿姆斯特丹的信息的意思，因此意圖是模糊的、有歧義的）

上述的例子中，用戶真正的意圖是：用戶想要聽音樂。

表達(dá)（用戶如何遣詞造句發(fā)出指令）

表達(dá)反映了用戶如何表達(dá)他們的請(qǐng)求。在給定的示例中，我們知道用戶希望通過說“ Play me…”在Spotify上播放音樂，但這并不是用戶發(fā)出此請(qǐng)求的唯一方式。例如，用戶還可以說：“我想聽音樂...?！?/p>

設(shè)計(jì)師需要考慮到各種表達(dá)方式的變體，進(jìn)行用戶問法擴(kuò)充，這將幫助AI引擎識(shí)別請(qǐng)求并將其連接到正確的操作或響應(yīng)。

詞槽

有時(shí)只有一個(gè)意圖是不夠的，我們需要用戶提供更多的信息才能完成指令。Alexa稱這些信息為“詞槽”，“詞槽”就像傳統(tǒng)表單一樣，它可以是選填或是必填的，取決于需要哪些去完成指令。

我們的案例中，詞槽是“放松的”，但是設(shè)備不需要它也可以完成用戶的指令，所以這個(gè)詞槽是可選的。然而，在用戶想要叫車出行的時(shí)候，關(guān)鍵的詞槽是「目的地」，而且它是必填詞槽?？蛇x輸入將覆蓋任何默認(rèn)值，例如，一位用戶要求出租車「下午四點(diǎn)」到達(dá)將覆蓋默認(rèn)值「盡快」到達(dá)。

使用對(duì)話流制作語音交互原型

語音交互設(shè)計(jì)師需要像編劇一樣思考、為每一個(gè)需求設(shè)計(jì)對(duì)話。對(duì)話是可交付的，概述了以下內(nèi)容：

觸發(fā)交互的關(guān)鍵詞；

代表對(duì)話可能會(huì)導(dǎo)致的分支；

用戶和語音助手之間的示例對(duì)話；

對(duì)話流腳本說明了用戶和語音助手之間一去一回的對(duì)話。對(duì)話流就像圖形界面設(shè)計(jì)中的原型圖，它可以被描繪成一個(gè)圖解（就像下面這個(gè)例子），有的原型應(yīng)用可以用來創(chuàng)建對(duì)話流。

一個(gè)闡明了意圖、詞槽和整體對(duì)話的示例對(duì)話

制作VUI原型的應(yīng)用

一旦你撰寫好對(duì)話流，你就可以使用app制作語音交互原型了。市場(chǎng)上已經(jīng)有了一些制作語音交互原型的工具，比如，Sayspring這款軟件幫助了設(shè)計(jì)師為亞馬遜和谷歌應(yīng)用創(chuàng)建了有效的語音原型。

Sayspring是一款可輕松實(shí)現(xiàn)Alexa技能或Google Home Action原型制作的工具

亞馬遜還提供了自己的Alexa Skill Builder，使設(shè)計(jì)師可以輕松創(chuàng)建新的Alexa Skills。 Google提供了一個(gè)SDK；但是，這是針對(duì)Google Action開發(fā)人員的。 Apple尚未啟動(dòng)其競(jìng)爭(zhēng)工具，但很快他們將啟動(dòng)SiriKit。

亞馬遜的Alexa Skill Builder，設(shè)計(jì)人員可以在其中為支持Alexa的設(shè)備制作VUI原型

語音應(yīng)用的UX分析

一旦你賦予了Alexa新的技能，你可以追蹤應(yīng)用和分析一起使用。亞馬遜和谷歌提供了一個(gè)內(nèi)置的分析工具；你也可以為了更縝密的分析整合第三方服務(wù)。（比如亞馬遜Alexa的voicelabs.co，或是谷歌助手的dashbot.io）。需要注意的關(guān)鍵指標(biāo)有：

參與度指標(biāo)，每個(gè)用戶的會(huì)話數(shù)量或是每個(gè)會(huì)話的消息數(shù)量；

使用的語言：

行為流；

消息、意圖和表達(dá)

VUI設(shè)計(jì)實(shí)用技巧

在設(shè)計(jì)移動(dòng)應(yīng)用和網(wǎng)站時(shí)，設(shè)計(jì)人員必須思考哪些是主要信息，哪些是次要信息（不那么重要）。用戶不應(yīng)接收過多的無用信息，但與此同時(shí)，他們又需要足夠的信息來完成任務(wù)。對(duì)于語音來說，設(shè)計(jì)師必須更加小心因?yàn)樗性~匯（可能是一個(gè)相對(duì)簡(jiǎn)單的GUI）都可以與之溝通。在傳送復(fù)雜信息和數(shù)據(jù)的情況下，這尤其困難。這意味著用更少的詞會(huì)更好，并且設(shè)計(jì)師需要確保該應(yīng)用程序能夠滿足用戶的目標(biāo)并保持嚴(yán)格的對(duì)話狀態(tài)。

確認(rèn)任務(wù)何時(shí)完成

在設(shè)計(jì)電子商務(wù)結(jié)帳流程時(shí)，關(guān)鍵屏幕之一是最終確認(rèn)界面。這使客戶知道交易已被成功記錄。

同樣的概念也適用于語音交互設(shè)計(jì)。比如，當(dāng)一位用戶在客廳要求語音助理關(guān)掉衛(wèi)生間的燈時(shí)，如果沒有確認(rèn)，他們就會(huì)走進(jìn)客廳并檢查，使語音應(yīng)用程序徹底失去能為用戶解放雙手的目標(biāo)。

在這種情況下，“廁所燈已關(guān)”的回復(fù)就很好。

創(chuàng)建一個(gè)強(qiáng)有力的錯(cuò)誤策略

作為一個(gè)VUI設(shè)計(jì)師，設(shè)計(jì)一套強(qiáng)有力的錯(cuò)誤策略很重要。始終針對(duì)語音助手根本聽不懂或聽不到任何聲音的場(chǎng)景設(shè)計(jì)一定的反饋或回復(fù)。分析還可以用于識(shí)別錯(cuò)誤的順序和誤解，從而可以改善錯(cuò)誤策略。

當(dāng)檢查替代對(duì)話的時(shí)候你需要問下面幾個(gè)關(guān)鍵問題：

你是否識(shí)別了交互的意圖？

AI是否可以解析用戶的信息？

AI是否需要來自用戶的更多信息以便更好地完成用戶的指令？

我們能否交付用戶要求的東西？

添加額外的安全性

谷歌助手、Siri和Alexa現(xiàn)在可以識(shí)別每一個(gè)不同的聲音，這為用戶增加了安全性。與面部和指紋識(shí)別ID相似，語音識(shí)別軟件正在不斷提高，模仿聲音已經(jīng)越來越難；然而，在現(xiàn)在這個(gè)時(shí)候，它也許還不夠安全，添加授權(quán)就非常必要。當(dāng)處理敏感數(shù)據(jù)時(shí)，設(shè)計(jì)師可能需要設(shè)計(jì)一個(gè)額外的身份驗(yàn)證步驟，例如指紋，密碼或面部識(shí)別。在個(gè)人消息傳遞和付款的情況下這個(gè)步驟顯得尤為重要。

百度的語音助手小度已在肯德基的多家餐館中使用，并使用面部識(shí)別功能根據(jù)年齡和歷史訂單提出用餐建議。

VUI革命的曙光

VUI現(xiàn)如今興起，并在接下來幾年會(huì)被應(yīng)用到越來越多的產(chǎn)品的中。有人預(yù)測(cè)未來十年我們不會(huì)再使用鍵盤與計(jì)算機(jī)交互。

當(dāng)我們思考用戶體驗(yàn)時(shí)，我們依舊傾向于看到或者觸摸到的。因此，語音作為一種交互方式很少被想到。然而，在設(shè)計(jì)用戶體驗(yàn)界面時(shí)語音和視覺并不是互斥的——它們都可以為產(chǎn)品增添價(jià)值。

用戶研究需要回答語音是否可以提升用戶體驗(yàn)，并且考慮到支持語音的設(shè)備的市場(chǎng)份額增長(zhǎng)的速度有多快，這個(gè)研究很值得花時(shí)間，因?yàn)樗梢詭椭嵘齛pp的價(jià)值和質(zhì)量。

了解基礎(chǔ)

什么是可觸摸的用戶界面？

一個(gè)可觸摸的用戶界面可以通過點(diǎn)擊、輕掃等手勢(shì)與設(shè)備發(fā)生交互?？捎|摸的用戶界面通常在觸摸屏上顯示。

什么是語音界面？

語音交互界面是無形的界面需要語音與其進(jìn)行交互。具有語音識(shí)別軟件的常見設(shè)備是Amazon Alexa智能揚(yáng)聲器。

Echo是做什么的？

亞馬遜的Echo智能揚(yáng)聲器使用語音識(shí)別軟件幫助用戶使用語音交互完成任務(wù)，即使用戶和Echo在不同的房間。Echo智能揚(yáng)聲器受到了語音助手Alex和被稱作“技能”的VUI app的助力。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

（譯）設(shè)計(jì)一個(gè)VUI——語音用戶界面