05.24 微軟收購NLP公司推進對話式AI進程,小娜將會更聰明瞭

智東西

編 | Rinchy

5月20 日,微軟宣佈他們收購了一家位於加州伯克利的從事“對話式AI”研發的公司Semantic Machines,來推動Cortana的語音服務及Azure Bot等產品的服務。本次收購後,微軟將在伯克利建立一個對話式AI中心,以推進 AI語音交互方面的發展。

二十多年來,微軟一直在研究和尋求對話式AI基礎算法的突破,如語音識別和自然語言理解。他們的目標是將電腦發展成為能夠看見它周圍的圖景,聽到並理解人類語言的終端。2016年,微軟在對話式AI的兩大方面有了新進展,分別為Bot的基礎算法,和AI語音助手中的語義識別和自然語言理解的基礎算法,這使得他們在對話式AI領域邁出了重大的一步。

微軟打算通過本次對Semantic Machines的收購,將他們的語義機器技術與自身人工智能的技術相結合,將對話式AI的技術提升到更高的水平,給用戶帶來更加強大、自然和高效的體驗。

微軟除了看中Semantic Machines現有的技術以外,公司內部實力不凡的研發團隊帶來潛力,或許也是促成本次收購的一大原因。無論微軟看中的是他們的技術還是團隊,都顯示出他們在發展對話式AI方面的決心。也展示出他們在與其他品牌,如三星的Bixby 2.0、谷歌的谷歌助理的激烈競爭中,不讓步的姿態。

一、 Semantic Machines公司的核心技術

Semantic Machines公司之所以被微軟收購,是因為他們開發出一種新型的適用於不同語言的技術平臺,使得人工智能不僅能識別人類發出的命令,還能理解人類的對話。他們開發出的新平臺代表了一種更加強大的範式,可以賦予計算機溝通、合作、理解目標和完成任務的能力。

微軟收購NLP公司推進對話式AI進程,小娜將會更聰明瞭

而這種範式的實現,利用的是專有的機器學習的技術。目前公司的核心技術有:

1、 對話引擎。Semantic Machines的對話引擎是一種用於建立基於語音和文本內對話,建立人類對話模型的新方法。引擎從自然輸入的聲音和文本中提取語義意圖,然後生成一個對對話狀態、文本和意圖的自我學習框架。這個對話引擎的自然語言生成(NLG)技術基於用戶的對話和文本而形成。

2、 深度學習。Semantic Machines為從語義分析到對話狀態,再到聲音和語言的模型,NLG和語音合成這一系列關鍵功能來開發出新型的神經網絡系統。

3、 聲音識別。公司的聲音團隊的研究員們來自於Dragon Systems, Voice Signal, Nuance 以及蘋果Siri部門,都曾引領過ASR技術的發展。現在他們正在建立一個能夠打破以往聲音系統的侷限性的新型語音平臺。公司的ASR技術提供給對話算法獨特的功能。

4、 語音合成。這對於對話式算法來說至關重要。計算機的聲音可以替代顯示器,提供給使用者他們想要得到的信息。現有的語音合成技術,特別是韻律模型並不能夠實現有效的對話時計算。公司利用廣泛的NLP和機器學習,開發出一款專有的語音合成技術,首次實現對話式算法。

5、 增強學習。這是他們的新平臺的核心組成部分。增強學習的技術賦予系統不斷從用戶身上進行學習並且實時擴展能力的功能。這種反覆地學習,使得系統提升了其對於語義的理解還有提高了學習新領域的知識的速度。

6、 數據庫。為了讓機器能夠學會說話和寫作,他們正在建立世界上最大規模的訓練語庫。其專有的技術可以實現大規模數據的抓捕、自動註釋和格式調整,為機器能夠學習人類的行為提供了可能。所以,這個數據庫是開發對話計算模型的關鍵。

7、 多種語言架構。他們開發的對話式AI技術基於獨立的語言框架。語音和語言的識別技術開始時都是使用的英文,但是也可以支持其他模式,比如類似普通話這樣的語言。

8、 開發工具。為了能夠增強和定製他們的對話式AI的功能,他們正在創建一套可供公司內部和合作夥伴共同使用的工具。通過使用這些工具,開發者們能夠把他們的對話式AI進行調整,運用到自己的場景中去,並且教授他們新的技能。

這一系列核心技術,構成了他們的對話式AI模型,通過建立數據庫進行深度學習,再引入對話引擎、聲音識別和語音合成,形成一套可適用於不同語言架構中的開發工具,這就是他們構建的平臺正在做的事情。

微軟通過收購該公司,掌握他們的核心技術,使用他們構建的這個完整的深度學習的平臺,訓練出對人類話語的語義理解更加透徹的程序,運用至他們的AI服務中,比如Cortana和Bot service,讓他們與人類的溝通更加順暢,提高產品的服務質量和水平。

二、Semantic Machines公司的團隊

Semantic Machines之所以能夠被微軟收購,不僅是因為他們在技術上有所長,而且,它還擁有一支強大的潛力無限的研發團隊。微軟可以借這些人才,來推進對話式AI的更多發展。

微軟收購NLP公司推進對話式AI進程,小娜將會更聰明瞭

公司聯合創始人兼首席執行官Daniel Roth,並不是語音識別領域中的新人。十幾年前,他創辦了一家名為Voice Signal Technologies的公司,專門為手機開發語音識別與合成系統,蘋果也使用了他們的這個技術。很快,他們便被Nuance Communication以3億美元的價格收購。接著,他的第二次創業的小型激光技術方面的公司Shaser BioScience也被收購。本次,他回到了起初的語音領域,開始第三輪創業。

而且,在他的第一次創業的公司中的老同事Larry Gillick,也加入了這個新公司,作為首席技術執行官。Larry 在語音領域有超過30年的從業和研究經驗。曾任帶領Dragon Systems的團隊,開發出第一款語音聽寫產品。後加入Daniel的Voice Signal Technologies公司,在公司被Nuance Communication收購後,又任新公司的移動設備研究副總裁。之後,加入蘋果Siri語音助手團隊。作為這個領域中的先行者和一直以來的實踐者,Larry具有過硬的技術能力,也瞭解當下最主要的需求。

除了Larry之外,研究團隊裡還有許多出色的學者。比如,有加州伯克利分校的教授Dan Klein。他是自然語言處理領域內公認的大牛,曾是微軟的教職研究員,還是Adap.tv的首席科學家,發表過100多篇關於NLP以及機器學習的論文。還有斯坦福大學的教授Percy Liang,他曾在谷歌工作過一年,是語義分析團隊的創始人之一,還在頂尖的學術期刊中發表了60多篇論文。現在,他是這個公司的首席科學家及計算機科學助理教授。團隊的其他研發人員,大多畢業於加州大學伯克利分校、斯坦福大學以及麻省理工學院,也曾在行業領先的公司內有過項目經驗。

通過收購這家公司,微軟在波士頓和伯克利附近增加了業務,同時增進了與許多優秀的對話式AI領域內的人才的距離。微軟人工智能及研究事業部的首席技術執行官David Ku說:“微軟將會基於伯克利強大的科研背景,去挖掘出更多的人才與技術。所以,他們將會在伯克利建立人才基地,通過基地的人才基礎,來推動對話式AI的發展水平。”

這個人才中心將會同微軟的其他對話中心一同工作,如Cortana Research部門、微軟在澳大利亞墨爾本的RMIT大學開設的Cortana Intelligence Institute、以及位於華盛頓州雷德蒙德的微軟AI和研究小組。

三、對話式AI在Cortana中的運用

Semantic Machines所研發出的對話式AI的技術在微軟的產品中的運用,將會集中在Cortana、Xiaoice、Azure Bot Service和Microsoft Cognitive Services,還有微軟用於客戶服務的AI解決方案以及面向企業客戶的其他對話計算技術等一系列產品上。那麼,對話式AI技術將如何改變Cortana呢?

Cortana由微軟語音產品團隊從2009年開始研發,直到2013年Build大會上才亮相於公眾。

微軟收購NLP公司推進對話式AI進程,小娜將會更聰明瞭

起初,Cortana作為應用被整合進Windows10的系統裡,而後微軟把Windows8.1的通用Bing SmartSearch功能融入到Cortana中,用戶可以通過發出命令,讓它經由搜索引擎自動完成例如在餐館網站上查找開放時間、顯示網站的零售優惠券或者在地址欄中顯示天氣信息等任務。用戶需要按下設備上的”搜索”按鈕,才能喚醒它,然後用語音代替鍵盤發出命令。從2014年10月推出Lumia Denim手機系列以來,Cortana增加了傾聽的功能,可以使用”Hey Cortana”的詞組將它喚醒。

Cortana在歷年的發展中,不斷地增添新的功能。但是這些進展都集中於使用平臺的擴展或者服務範圍的擴大。2016年,微軟將其整合進Skype中,作為一款機器人,它開始與人類進行對話。然而,它只能識別出人類對話中的關鍵字,進行簡單的搜索引擎式的回應。這種對話也通常是命令的另一種表現形式,Cortana可以為用戶提供訂購食物、預定形成、錄製視頻信息並預約日曆等回應或者說服務。

可見Cortana只是基於對於用戶在pc端或者移動端留下的數據信息,以及整合搜索引擎或第三方的應用,來滿足用戶在日常生活和工作中提出的簡單需求。但是在與用戶溝通,特別是情感交互方面,較為欠缺。相較於當聽到人類說出冒犯之詞,會立即給人類打電話的小冰而言,Cortana對於人類話語的理解及交流的能力稍遜。

但是,David Ku說:“如果將Semantic Machines的技術融入了Cortana中,它將變得更加的聰明、靈活,可以用更少的詞來完成更多的任務。”

“從最終用戶的角度來看,我們將使用語義機器方法來創造新的功能,可以識別更復雜的語言變化。例如,您可以發出命令然後回頭說‘不,我的意思是不要把它發送給我的老闆,將它發送給我的老闆的‘老闆’,並讓系統適應性地從上下文中分析出您的語義,這樣您就可以不必從頭開始來重複之前的內容。從用戶的角度來看,它更具有彈性和適應性的語言理解與操作的能力。”David Ku在接受VentureBeat的採訪時說道。

Cortana目前的語音應用程序是使用Azure Bot Service或者Microsoft Bot Framework來創建的,本次收購後,微軟將Semantic Machines技術集成到Microsoft產品,開發人員能夠通過深度學習來訓練語音應用程序的新功能。

結語:左手技術右手人才 微軟推進對話式AI發展

微軟通過收購Semantic Machines,不僅擁有了他們在語音識別和自然語言理解方面的技術,還收穫了眾多對話式AI的人才。而且這些人才將會吸引更多的同領域人才來,共同致力於推進這方面的技術。

從微軟本次的收購行為看來,他們對人工智能的下一步規劃中,讓它們能夠更快速精準地識別出人類語言中的意圖,並作出更像人類的回應,而不是僅僅侷限於功能性地完成任務,是非常重要一個發展方向。

前幾日微軟在北京舉辦的人工智能大會上,在對小冰的介紹中,他們說道:”在小冰的開發中,最重要的是信任。”而信任來源於理解,對於人工智能產品而言,理解,意味著在語音識別和自然語言理解方面的技術突破。微軟,正在構建這種信任,創造出更多能夠與人類順利交流的產品與功能。

來源:VentureBeat;Semantic Machines


分享到:


相關文章: