05.23 史上最速度的機器收銀員,1分鐘不到狂點30多杯咖啡秒殺人類

文|AI財經社 周晶晶

編|趙豔秋

“五個巧克力、兩個香草拿鐵,算了,巧克力不要了。”鄢志傑以最快每秒5個字的語速向站在一旁的咖啡師點單,後者不得不選擇中途放棄,“太快了,記不下來”。

鄢志傑又轉向一臺除了屏幕通體都是白色的機器點單師求助,後者在49秒內,記錄下他點的30多杯咖啡, 對其點單過程中包括修改、刪除、加單等要求進行了精準回應。人類咖啡師在聽了鄢志傑第二次複述後完成了訂單,用時2分37秒。

史上最速度的機器收銀員,1分鐘不到狂點30多杯咖啡秒殺人類

這是發生在5月23日雲棲大會武漢峰會上的一幕。鄢志傑是阿里巴巴機器智能技術實驗室語音交互首席科學家。

“我們將機器對人類口語的理解能力帶到了新的高度”,鄢志傑表示。在過去,機器語音交互通常需要"語音喚醒+語音指令"兩個環節,此次免喚醒的語音交互,打破了傳統命令式交互方式。

升級後的語音交互方式突出的優勢在於,在整個交流過程中,顧客不需要說”hi,點單機“之類呆板的喚醒詞,可直接下單,更符合人與人的自然對話。這種更流暢的人機交互模式,被阿里稱為“流式多意圖口語理解引擎”。

體驗升級的背後是技術的更迭。據鄢志傑介紹,這些模塊並非簡單級聯,而是深度融合而形成了多模態語音交互方案,包括是公共場所強噪聲環境下的信號處理和語音識別、視頻識別與面部識別、場景感知等多模態融合的感知智能。

史上最速度的機器收銀員,1分鐘不到狂點30多杯咖啡秒殺人類

目前,該語音解決方案除了可替代收銀員,還能在地鐵賣票。目前,在上海地鐵已實現落地。乘客直接說出目的地,售票機便可選擇合適的站點和路線。測試數據顯示,普通買票耗時往往超過30秒,而語音購票全程只需要10秒左右。

據介紹,目前已經落地的場景還包括車內語音助手、電話智能客服、可免遙控器操作的遠場語音電視等。“未來我們希望實現公眾空間裡的萬物皆能對話。”鄢志傑表達了願景。


分享到:


相關文章: