發(fā)布時間:2024-1-3 分類: 行業(yè)資訊
這個項目的時間不是很緊張。我有時間探索一些細節(jié)。有些事情可以做我不能做的事情。探索它背后的原因是非常有趣的。
一、簡單介紹VUI
據(jù)推測,每個人都不太熟悉語音交互,而且汽車上的語音交互更加奇怪。在這里,我將談到科學普及的背景。至于對這方面更感興趣,我可以找到這些信息。我認為其他文章將詳細介紹該理論。在這里,我將討論實際應用中對需求的探索。
首先,語音交互來自交互式語音應答(IVR),它通過電話執(zhí)行任務。與10086不同,它識別人們所說的內(nèi)容,因為它擅長處理大量信息的復雜信息。句子,應用場景更廣泛。
智能手機快速發(fā)展后,VUI(語音用戶互動)誕生了。 Siri和Cortana是典型的應用程序。語音交互一直被稱為“最自然的交互式門戶”,其優(yōu)缺點是顯而易見的。
汽車場景的語音交互具有明顯的優(yōu)勢:不需要駕駛員分散操作,直接語音命令可以達到預期目的。因此,在汽車中使用語音交互,任務類型要求將占大多數(shù)。
二、實際應用中遇到的問題
我今天在以前的產(chǎn)品文檔中看到了這個設計:
目前的設計是由于技術限制。不支持的語句不能用于下一輪對話,因此在反饋完成后直接退出語音。沒有大問題,許多車載電話語音交互直接表明它們不受支持,以下聲明沒有。但是,這個程序仍然極大地妨礙了他們使用語音的熱情。此設計至少不適合以下幾點:
在人工智能不是非常智能的情況下,嘗試了解用戶的意圖并允許用戶繼續(xù)說話。
功能點設計應考慮可發(fā)現(xiàn)性。對于語音交互,隱形交互方法應該提高其可發(fā)現(xiàn)性。
已知的對話原則之一:這種方式的原則,即清楚說話的需要,可以在這里簡化,但也需要針對不同的用戶群。
三、從用戶出發(fā),了解說出這句話的初始意圖
在我看來,語音交互是一個繁瑣的設計過程,因為不同場景中的用戶會說出難以預測的內(nèi)容,因此我將選擇一些最常見的使用場景,然后按照每個場景的最佳路徑(相同的寫入)與業(yè)務流程相關的示例對話框,以及異常。
切換播放模式時這是一個異?,F(xiàn)象:
用戶:幫我切換到隨機播放/隨機歌曲/單曲…
TTS:隨機播放
(TTS:從文本到語音,文本到語音通常是由產(chǎn)品和交互設置的內(nèi)置文本。當用戶說某句話命中某個語句時,則廣播對應于該語句的反饋語言。整個過程是甚至做是一個完整的對話交互設計。)
讓我們看看為什么用戶這樣說,“切換播放模式”:
在移動應用程序中,切換播放模式,全部點擊切換到所需的播放模式,三種播放模式都是固定順序,所以用戶會想要在汽車上繼續(xù)這種操作習慣,會有這樣的說法。
我知道播放模式是什么,但我不知道汽車上的語音控制是什么,所以我試探性地嘗試了。
我不知道哪種播放模式,所以我只想看看哪種播放模式可用
無論起點如何,最終目標都是切換模式。
四、根據(jù)不同意圖,對用戶進行分類,尋找更好的解決方案
根據(jù)以上三種情況,可分為:
對于熟悉音樂的用戶,請?zhí)剿髟谄嚩耸褂谜Z音控制。
對于不熟悉音樂的用戶,請?zhí)剿髟谄嚿鲜褂谜Z音控制。
讓我們來看看語音切換模式需要解決的問題:
無需關注界面,直接釋放語音命令即可實現(xiàn)目標;
縮短用戶的操作路徑:例如,如果您在手機上切換播放模式,有時需要點擊兩次;并且汽車機器直接發(fā)出顯式命令并直接完成它。
來,首先分析上述兩個用戶組的更深層次的用戶定位。
1.熟悉音樂的用戶
移動電話上的大多數(shù)操作都是因為播放詳情頁面上的操作按鈕太多,因此播放模式包含在按鈕中。以下是不同的音樂界面。故意選擇一些不太受歡迎的音樂應用,這是出乎意料的酷。狗是可選的,基本上其他應用程序使用點擊播放模式交互;
更進一步,移動電話用戶在兩種情況下在播放模式之間切換:
第一個熟悉播放模式的人,在操作前會有心理上的期望,所以它會被設置為她想要的播放模式,播放模式最多可以切換三次,用戶成本不高高,所以這也是大多數(shù)移動應用程序?qū)⑵涮砑拥綀D標的原因;
第二種類型,不熟悉的人,可能想知道他們在手術中有什么游戲模式,最后確定最終的心理預期,所以點擊次數(shù)將超過三次。
總之,無論熟悉程度如何,都會有一個既定的心理目標,具有明確的操作意圖。
熟悉音樂應用程序的用戶群基本上是集中的:大約18到40歲,他們基本上知道有三種游戲模式,所以你可以有以下做法:
實踐1:經(jīng)過深思熟慮的指導,讓他們的意圖變得更清晰,這樣就不會有這樣的陳述;直接命令切換還可以減少用戶的操作路徑并降低用戶的運營成本。
練習2:首先完成用戶目標意圖:切換播放模式,然后提示用戶可以切換哪種播放模式,以便用戶逐漸熟悉
練習3:完成用戶的目標意圖,不提示,三種播放模式可能是懶惰的,不想說具體的播放模式名稱,所以只記得一個聲明就可以實現(xiàn)。
2.不熟悉音樂的用戶
我特意找了親愛的爸爸,并要求他的中年和老朋友開車,年齡在40-50歲之間,其中大部分都在45歲以下。以下是一些聊天。
我的問題:當你播放音樂時,你知道你可以在播放模式之間切換嗎?如果你知道,你知道有幾種播放模式可以切換嗎?請列出您的印象。在這個過程中,不要打開音樂應用程序來查看它,依靠自己的記憶?
對我來說,可能被調(diào)查的目標用戶在一線城市會有不同的結果,這是非常意外的。但有多少中老年人居住在一線城市?大部分中老年人生活在非一線城市。對他們來說,簡單地播放歌曲可以滿足他們對音樂的需求。
但是,是否有必要像這樣推送這個功能?
讓我們來看看將使用智能汽車的人的分布:(來自互聯(lián)網(wǎng)的數(shù)據(jù),隨時查看)
65%的中國消費者愿意接受車輛互聯(lián)網(wǎng)功能,其在歐洲國家高于40%,在北美高出32%。中國消費者也更愿意嘗試與娛樂相關的功能,如社交媒體,汽車視頻和音樂。
在未來十年,55歲以上的人口將增加近1億人。與此同時,在90年代更換80后,它將逐漸成長為主要的消費市場。 2015年,這一數(shù)字已達到2億。消費者對年輕人和老年人的需求變化值得探索,以便提前贏得市場。
因此,中年和老年人的需求還有待挖掘,所以我認為這里應該做的是音樂推薦的智慧,這樣他們就可以享受人工智能的好處;而不是引導他們使用新功能,以便使用它們,操作成本大大提高,并且他們的內(nèi)存負擔也增加了。很明顯,汽車的語音交互只是想減少用戶對駕駛的干擾,這與我們想要做的相反。
五、結合推薦做法、語音交互優(yōu)化準則,確定最后的方案
在用戶組分析和對需求的深入分析已經(jīng)結束之后,有必要根據(jù)開頭沒有到位的點來澄清最終計劃。
根據(jù)第二和第四個可優(yōu)化的要點和推薦的做法,讓我們進行比較和分析:
第一種方法是互動指導。實際上,在整體方案設計中,需要考慮如何引導用戶理解語音交互。
第二種和第三種做法符合理解用戶的意圖,可以提高可發(fā)現(xiàn)性。不同之處在于后續(xù)信息是否提示用戶。但是,這里的糾結點有以下幾點:
提示用戶,他們可以清楚地知道他們可以說什么,但聲明太長,無法精簡,并且對用戶有一定的內(nèi)存負擔;
用戶不會被提示,他們可能不明白可以直接操作播放模式的名稱,這更簡單,更有效。
讓我們澄清設計目標:簡單,高效,而不是分散注意力;所以提示是必須的。為了澄清這些,繼續(xù)參考本書中的參考 - 《語音界面用戶設計》,根據(jù)語音用戶界面基本設計原則中的異常處理,增強的錯誤提示有這樣的對話示例:
天氣APP:我可以為您提供天氣信息。你的州和城市在哪里?
用戶:En…我在斯普林菲爾德。
天氣APP:對不起,我不明白,請說州和市。
網(wǎng)友:哦,我在明尼蘇達州的斯普林菲爾德。
這種異常處理促使用戶需要清晰的信息,然后我們的解決方案也可以采用這樣的方案:
用戶:切換播放模式
TTS:好的,你想切換到什么樣的播放模式?
用戶:隨機播放
TTS:Switched,下次你可以隨便跟我說話。再見?
這樣的解決方案似乎是如此智障嗎?
語音交互方案一直處于發(fā)現(xiàn),改進,探索,制定,糾纏,推翻和持續(xù)優(yōu)化的過程中。在這方面沒有很多類似教科書的理論,所以記錄從分歧到下一個優(yōu)化點。制定優(yōu)化計劃的小過程可能是微不足道的,分享語音交互的日常工作,并希望幫助想要知道的人它。
作者:江青,微信公眾號:莫奇BTS站和大胖子
本文最初由@青絳發(fā)表。未經(jīng)許可,禁止復制。
該地圖來自的,基于CC0協(xié)議
周一周五 8:30 - 18:00