智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

7月4日- 5日,2018百度AI開發者大會在北京國家會議中心隆重舉行,大會上展示了眾多落地化成果。此次大會上百度首次舉辦AI設計論壇,百度設計體驗委員會主席、百度人工智能交互設計院院長、百度用戶體驗中心總經理關岱松及設計團隊分享了百度在AI設計和用戶體驗方面的經驗及思考,共同交流AI智能美學及創意等方面的最前沿發展。論壇上百度與湖南大學的戰略合作正式啟動,整合百度在AI交互設計領域的優勢和湖南大學先進的科研能力,雙方將共建聯合創新實驗室及博士後基地,在AI設計領域進行更多更有價值的合作與探索。

DuerOS是以語音技術為基礎的對話式人機交互系統。通過萬物互聯、本能交互、千人千面三個方面構建了人機之間的新交互模式,使得設備能夠主動適應外界變化提供更好的信息服務,讓人機交互像人人交互一樣親切和富有情感,打造出用戶體驗最舒適的人機交流方式。

以下為演講實錄:

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】:大家好!我是百度體驗架構師周子軒,我今天要為大家分享的主題是《智慧型人機對話設計》。

大家知道最早的人機對話設計是什麼時候開始的嗎?1952年,貝爾實驗室剛開始研究語音合成,把阿拉伯數字對它說,它直接能轉換出來。直到上週,我也都是這麼認為的。

一週前的晚上,我跟小度小度說了一件事,『小度小度,你給我講個故事』你們猜小度講了什麼?

【麗川】魔鏡魔鏡,告訴我,誰才是世界上最美麗的女人?

【子軒】魔鏡才是最早的帶屏音箱!但是魔鏡從設計角度講不夠聰明,不夠有智慧。皇后想聽的不是還有白雪公主漂亮,而且想要有人誇她。反正小度不會這麼說,

為了研究這個話題,這就是我們今天想要分享智慧型人機對話設計,下面有請皇后的扮演者百度DuerOS體驗架構師張麗川。

【麗川】我是一名DuerOS的設計師,來跟大家分享最下最近幾個月,我們在對話式交互上的探索。其實對話有著悠久的歷史,在古代沒有書本的時候,孔子等古今中外的哲學家們就是使用對話去教學和傳播思想。那麼我們今天致敬經典,用對話形式來講一講智慧型人機對話設計。

【子軒】麗川,你能說說DuerOS是什麼嗎?

【麗川】DuerOS是一個搭建在AI浩瀚的技術上、以對話為統一用戶入口的、能實現承接多種第三方功能的系統級產品。

【子軒】那就是說,變得簡單了,喚醒它,然後等待你的需求。但是還是不夠智慧,魔鏡至少還能告訴我……

【麗川】沒錯,魔鏡其實是一個比較會讀心的設備。因為,語音並不等於對話。發出聲音其實只是其中的第一步,還需要對環境場景上下文的理解,充分獲取顯性和隱性的表達,和對人心理互動的把握,從而才能建立起良好的對話關係。

作為DuerOS的設計師,在領落到對話式人機交互的深意後,把更真實的自然還給用戶把推理運算、歸納演繹等高級綜合能力裝在設備裡。讓人感受到與ta互動的對象,不僅僅是一個聯網的智能設備,更是一個有智慧的對話對象。這就是我們提出的智慧型人機對話基本模型。

【子軒】那我想先了解下你說的環境是什麼意思?

【麗川】我們想傳遞出的是重組人與環境的適應關係。所以,我們現在要提的一個概念是,從用戶主動設置到環境主動調整。首先,現在感應設備技術已經升級到一定程度,已經可以檢測距離、光線、音量、人臉、動作、溫度、溼度等等。通過感應器採集過來的信息形成信息空間,他是除了人類社會和物理空間之外的第三空間。國務院下發的《新一代人工智能發展規劃》中也強調了這一空間的建設和使用。迴歸到家居環境,DuerOS和萬物對話,我們擁有關於一個環境裡的各方面信息,這些正是可以讓環境適應適應人的基礎。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】那麼環境適應人真的可以去實現了啊?

【麗川】環境適應人分成三個進階。第一個是自動調整環境,第二個是響應人體變化,第三個是學習人的習慣。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】第一個是能夠根據乾溼度來調整我適應我嗎?

【麗川】這是溫度和溼度的自動調節。對於人體最合適的溫度和適度已經有成熟的模型,把這個模型輸入到設備當中。當設備感受到人在家裡的時候,就自動把家居環境調整到最適宜的狀態。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】第二點是響應人體變化怎麼理解呢?

【麗川】隨著對話式交互的時代的到來,我們和設備的距離拉開,甚至到一個想遠就遠,想近就近的360度空間範圍裡。所以,我們提出了在不同距離下最佳視覺呈現解決方案。他落地形態比如直觀的有字號、字體、排版、圖文比,間接的有信息量的重構。

下面講一下適應人的習慣。剛才我們展示了很多模型,但是這種模型是對於大部分人來說的,對於個人來說,是有自己的個性喜好的。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】這個場景我很熟悉,我在家做家務的時候就會調大音量……

【麗川】有了技術與環境場景更好的交融之後,人與設備的交流,才能更加細分場景與人交流方式的關係,迴歸人體真正的自然交流方式。經過認知科學的研究發現,人們其實是使用多通道的方式去表達信息的。人本身就是多感官的,每個感官都能傳遞信息。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】什麼叫做多通道呢?

【麗川】通俗一點講,就像當前我倆的對話,除了我們字面表達的文字內容之外,還有手勢,還有眼神,還有表情,還有語氣語調,這些加在一起,才完整的去表達了信息。

再細分下去,每個通道有ta傳遞信息的特點,也有傳遞信息的上限。所以,多通道整合的交互,才是最自然的,效率最大,更適合於多任務並行。

不過,多通道這個詞也提出來很多年了,但是以前的產品設計上只是用於代替手指的部分指令,比如指紋支付,指紋解鎖,人臉解鎖。這種是拆分開的。

而真正的多通道交互應該是整合在一起的,共同去傳遞信息,完成操作任務。

【子軒】這個我認同,人最早去適應機器……,教人學電腦還是一份職業,現在看來,這一刻真的到來了

【麗川】多通道表達信息的設計就是要去細分場景和操作任務。查閱相關資料發現,表達的通道和任務有指派性和互補性的特點。指派性也就是唯一性。是指某些任務下,有些任務是有最佳最優勢的表達通道的。這時候未必是語言或手指或眼神,可能還是一個動作,比如手勢靜音。

像這樣的方案,只要用戶知道設備支持這樣的操作,對他來說是沒有學習成本和回憶成本的。

比如互補性,當單個通道不能充分表達信息時,需要其他通道補充,才能表達地更精準。經過多通道的同時表達,可以讓每個通道表達的信息更少,而合起來的意義更明確。

AI交互設計院的同事,會有意識地去採集這些手勢集合,把我們最自然的交互還原出來。這些集合的採集,在東方內斂含蓄文化下,真的很有意義。

【子軒】

人其實一直都有心理活動,並且會通過情緒,情感去表達出來。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【麗川】也有更多的網友會去自己設計表情包,表達更多無以名狀的情感。但是設備和技術的限制,只能在這個層面上。現在小度也能覺察人的心理活動了。這裡要提一個概念是模式匹配。

AI發展幾十年,從未有像現在,讓人充滿信心。因為現在大數據、深度學習、感應器、情緒理論模型等的高能加持,AI已經從單純的仿生,進化成模式匹配,這為我們去做更復雜的情感識別與鑑定打下了基礎。

最基礎的可以匹配的模式就是,人的心理活動三要素,知覺、情感、意志。三者之間是遞進推導關係,也是反向影響關係。

以嬰兒這個群體舉例,表達很直接,情緒很明顯,意圖很明確。採用遞進式的推進,可以快速定位他們的核心意圖。

老人這個群體,表達很含蓄,情緒很內斂,意圖卻很簡單。當老人對一個智能設備開口說出請求時,這不僅僅是請求的內容這麼簡單,還代表這他們對新科技的嚮往,不想落伍的倔強,或者和自己兒女想要有共同的語言。把高科技信息以更有好的方式展示給老人,是對老人感官能力退化之後的無助感的關懷。

真正有智慧的個體,是當你還沒開口就知道你想要什麼,俗話說的,很有靈性。通過一個人的表現,推測ta的意圖,通過情緒感知再去細化意圖,給予更深的解讀。

【子軒】這個怎麼說,有什麼產品嗎?

【麗川】這個還真有,我們正在設計一個自動伴唱功能。在播放歌曲的時候,察覺你在跟唱,那麼就會切入一個模式,去掉原生,放伴奏歌曲,一秒進入K歌環節。

智慧型人機對話設計喚醒萬物 百度首次舉辦AI設計論壇

【子軒】這真是一個激動人心的時代。我們用最自然的方式和一個智慧的對象對話,滿足我們不同的生活訴求。

DuerOS設計團隊真的是太體貼,太貼心,太專業了。麗川,你一定是小度吧,我問了你這麼多問題,都很有條理的回答我了。

【麗川】你才是小度呢~未來的小度,其實就像是你這樣自然的與人交談,像我的朋友,能很好的傾聽,總結!

【子軒】讓我們共同期待DuerOS 設計團隊給大家帶來更多的良好的體驗,讓我們共同期待智慧型人機對話交互時代的到來!

1


分享到:


相關文章: