語音交互該用在哪裡?

語音交互該用在哪裡?

語音要麼是項天才的技術,終於迎來了屬於它的時代,要麼就是歷史上繼“聊天機器人”、“區塊鏈”或者“遊戲化(Gamification)”之後的最名不副實的浪費時間的事情。

現實沒有那麼戲劇化,反而更微妙。語音作為一個可以被大規模使用和設計的新的輸入/輸出接口,做產品和設計的那些人現在應該趕緊學習兩件事:什麼時候這樣的接口才能變得足夠好用,和如何才能利用好這個最新的接口形式。

開場已經結束,好戲將要上演

語音交互該用在哪裡?

創新想法的發展曲線

Alexa,Siri,Cortana和“Okay Google”最近的出現並不意味著語音已經“終於”到來了。恰恰相反,這意味著我們終於上道了。概念演示,循環炒冷飯和過度承諾的階段已經結束。從現在開始,要麼是真實的技術找到了真正的用戶場景,要麼就是一地雞毛,打包回家。

每一項重大的新技術都必須經歷一個創新的“長鼻子”。微軟研究院首席研究員比爾·巴克斯頓(Bill Buxton)經歷了歷史上每一次新的用戶交互方式,並估計新的UI從“研究項目”到完全成熟(定義為產生10億美元的業務)需要30年時間。

所以創新都需要一段時間,但是當這些新的用戶交互形式來臨之後,我們不應該指望它立刻取代現有的輸入方式,而是一種補充。

疊加而不是取代

語音交互該用在哪裡?

新的科技只會疊加在舊的科技上面。新的輸入設備不會淘汰他們的前輩:語音不會淘汰觸摸屏,觸摸屏沒有淘汰鼠標,鼠標沒有淘汰命令行。分析家們渴望一個簡單的故事,即每種新技術的誕生都立即預示著前一種技術的消亡,但接口本質上是多模式的,多多益善。每一項新技術都是從一個新的未滿足的細分領域開始,並逐漸擴大,直到找到最適合的領域。而聲音可以從一個很好的利基市場開始…

場景角色-地點是如何限制我們與設備互動的

語音交互該用在哪裡?

比爾·巴克斯頓(Bill Buxton)介紹了“場景角色”(placeons)的概念,改變了人物角色的概念,以顯示一個位置如何限制有意義的交互類型。沒有“最好的輸入”或“最好的輸出”,這一切都取決於你在哪裡,這反過來又定義了什麼是你可以自由使用的。

在一個非常簡單的層面上,人類有手,眼睛,耳朵和語音。 (讓我們忽略“感覺”震動的能力,因為這目前只能作為警報)。讓我們看看一些真實的情景:

  • “圖書館裡面帶著耳機”,這個場景角色是“手不受限,眼不受限,語音受限,耳朵不受限”

  • “烹飪”的場景角色是“手很髒,眼睛不受限,耳朵不受限,語音不受限”

  • “夜店”的場景角色是“手不受限,眼睛不受限,耳朵受限(你根本聽不見),語音受限(你可能沒法說/沒法聽)”

  • “開車”的場景角色是“手受限,眼睛受限,耳朵不受限,語音不受限”。

基於上述情況,您可以看到語音用戶界面在哪些場景中是有用的,並且可以看到語音作為輸入機制的作用。但是在大多數場景角色裡,語音並不是最理想的。

語音交互困難重重

語音很慢而且很容易出錯,速度和準確性比其他所有用戶界面都差。沒錯,我們講話的速度比我們打字的速度快,但目前最先進的音頻處理技術仍然要求我們要降低語速,字正腔圓。其次,聽比閱讀慢得多,尤其是聽音頻文件。我們閱讀的時候可以快速掠過一些文字,這也是為什麼可視化語音郵件如此受歡迎。

目前看起來有兩點是非常清晰的:

  1. 語音是不合格的輸入/輸出機制

  2. 有很多情況下,它成為最好的輸入方式的原因是它在那個場景裡是唯一可用的。

語音的想象空間在哪裡,有多大?

這個問題已經在無數的小組論壇裡面討論過了,答案通常是“因情況而異”,但問題最好再具體一點:

有多少情況下語音是最合適的?

今天,駕駛和“在家附近走動時播放音樂”似乎很適合語音界面,但是還有多少其他場景會出現?用戶案例會轉向效率工具還是繼續停在休閒場景?人們是否希望通過他們的AirPods讀取他們的電子郵件?

語音處理能變得多好,什麼時候能變好?

世界上絕大多數人說話速度比他們能打字的速度快,但現在語音識別技術無法可靠地跟上人講話的速度。語音輸入距離能完全跟上人講話的速度還有多遠?

什麼時候真正的多模式交流才能真正起作用?

語音交互該用在哪裡?

這個問題也被稱為是“圖書館-司機問題”, 提出這個問題其實是為了討論如何在不同的輸入輸出機制下彼此溝通。 雖然目前大多數消息傳遞產品都包含異步語音片段,但是它們要求消息的接收方式與生成方式相同。用戶間的溝通媒介必須保持一致,當他們處於不同的環境中時,就無法溝通了。這導致了前文中的“圖書館司機問題”:如果米歇爾在圖書館裡,愛麗絲正在開車,他們怎麼能交流?

愛麗絲正在開車,所以不能用她的雙手或眼睛,米歇爾不能在圖書館裡說話或發出噪音。在一個理想的通信應用程序中,用戶可以以任何他們想要的方式編寫和消費消息。通信應用不應該為任何形式的溝通製造障礙。

既不是一個平臺,也不是一個範式

雖然聲音不是一個平臺,也不是大家聲稱的新的UI範式,但它是另一個我們必須設計和交付的新界面,否則我們很可能犯了和下面這些人一樣的錯誤...

鼠標對那些經營者來說是不可能比鍵盤感覺更好的,它的滾動性讓我們嗅到了一絲媒體炒作裡狡猾的氣息。

Computer world, 1983年10月

鼠標的想法很好,但是對商業用戶的價值存疑。

George Vinall, PC week, 1984年4月

我覺得鼠標挺好玩的,但對於我運營公司來說,我必須得考慮效率的問題。

George Vinall, PC week, 1984年4月

鼠標和同類產品僅僅是用戶演進過程中的一個插曲,今天聽起來革命性的創新其實並沒有對任何具體的人或事產生價值,這項發明的商業前景堪憂。

David A. Kay, Datamation, 1983年10月

並沒有證據表明用戶會開始用這些新的工具。

John C.Dvorak, San Francisco Examiner, 1984年3月

鼠標對於特定的用戶群體,比如說公司經營者來說,讓電腦變得更方便易用,更簡單了嗎?答案是否定的。

Computer World, 1983年10月

編譯自客知音團隊,英文原文發表於Intercom博客。


分享到:


相關文章: