05.22 黃學東:微軟“全武功”解決企業會議的痛點


黃學東:微軟“全武功”解決企業會議的痛點

新智元報道

【新智元導讀】昨天下午,微軟全球技術院士黃學東博士、微軟大中華區副總裁兼市場營銷及運營總經理康容、ROOBO CTO雷宇接受了包括新智元在內的媒體專訪,詳細解答了微軟的語音技術、產品落地以及生態合作。

黃學東:微軟“全武功”解決企業會議的痛點

在昨天的微軟人工智能大會上,微軟全球技術院士黃學東展示了微軟多項語音、翻譯等技術,微軟Build大會上的“黑科技”全球首創AI會議系統再次被演示。

昨天下午,黃學東博士、微軟大中華區副總裁兼市場營銷及運營總經理康容、ROOBO CTO雷宇接受了包括新智元在內的媒體專訪,詳細解答了微軟的語音技術、產品落地以及生態合作。

新智元根據現場速記進行整理,部分內容有刪節。

黃學東:評價谷歌沒有什麼意思,微軟的“全武功”最有意思

問:您一直關注語音技術,現在很多搜索引擎還是通過輸入文字來進行交互,什麼時候我們能夠看到像語音識別或圖像技術真正改變到搜索引擎現在的狀況?

黃學東:搜索引擎現在很複雜,我做語音之前做過搜索引擎,後臺要完全瞭解所有的文件內容和關鍵是字是什麼東西,還要匹配用戶意圖,找到相應的文本,它也有很多人工智能深度學習的技術。

語音識別在現在的媒體階段,是文本輸入還是語音輸入還是圖像輸入?基本上還是一個相對比較松的耦合。語音進步的主要標杆是把波形轉換成文字,這個過程中中文字也可以有不同的選擇,因為語音識別不是完全的準確,就像搜索引擎一樣,有第一個好結果,有第二好結果、第三結果,把整個結果給搜索引擎,搜索引擎在搜索的時候可以搜索不僅僅是第一好的結果,而且把語音識別第二好的結果也考慮進去。現在工業界的狀態基本上是這樣。

問:麥克風陣列部分經常在語音識別場景下遇到噪音問題,微軟可以解決這個問題嗎?還是說未來我們可以有更好的方法?

黃學東:我們有麥克風陣列的核心技術,並且已經有長足的進步,在業界是領先的。再加上360度的攝像頭,這兩者的結合讓會議“AI神器”達到了很高的高度。不管是講了什麼話,各方面的指標都上了一個臺階。今後,我們的前景非常非常樂觀。

問:

之前谷歌Duplex打電話號稱已經通過了圖靈測試,你對這個怎麼評價?

黃學東:不敢評價。媒體上很多評價說他們在作假,很多人質疑谷歌,讓谷歌發言人出來認證,他們不出來認證,也不說話。

微軟會議“AI神器”在多人自由交談的情況下能知道誰在說話,而且知道說了什麼話,做了現場演示。不僅做了中文,還做了英文,這是我們要表達的微軟在語音識別業界的領導地位,是全武功,那個武是武力的“武”,不是一二三四五的五。

所以說批評谷歌沒有什麼意思,我們的“全武功”最有意思。

不僅能支持全雙工,而且能支持“全武功”

問:上午微軟展示了人工智能的系統,有哪些東西是微軟從底層基礎研發到開放再到產品的生產製造?有哪些是把底層的技術開放給夥伴,他們基於平臺和技術做產品的研發和人工智能應用產品?

黃學東:首先,這些是研究的演示,微軟從來不預先宣佈我們產品什麼時候出來、以什麼方式出來。我們產品有幾個東西可以講,第一是我們的認知服務,語音這一部分雲的API、模型、服務,有一套新的規律,這是在微軟Build大會上已經宣佈了的。

第二是定製服務增加了語音合成,想要換成自己想要聽的聲音,可以上傳三個小時、十個小時,越多質量越好,可以定製到你想要的聲音。所以我們全線語音和翻譯都實現了量身定製。

現在如果你是開發商要開發自己的音箱,可以用微軟剛剛推出來的MSDDK,這是我們和ROOBO合作推出來的一個最新解決方案,不僅僅有微軟和ROOBO合作推出來的硬件,而且有最新的麥克風陣列,包括四麥線性的和七麥原型的麥克風陣列。這個黑科技是絕對引導業界潮流的,我們不僅能支持全雙工,而且能支持“全武功”。

康容:我補充一下,因為微軟是一個平臺和工具的企業,我們是提供平臺和工具,我們的黑科技、研發團隊、我們的大咖博士發明的東西,他們漸漸的會落地到我們自己的產品中,也會提供給我們的生態合作伙伴讓他們來開發。

黃學東:微軟“全武功”解決企業會議的痛點

今天早上看到哪一個黑科技會在什麼時候落地,很難講出來,但是遲早會發生。我們會盡快的落地,我們會看市場的需求。所以,我們聽到越多的客戶和合作夥伴的聲音,我們就會加速某某功能儘量落地。我們一系列的很多新東西都會提供給生態一起來合作。

問:ROOBO本身是針對不同的應用場景解決人工智能軟硬結合方案的設計,然後去生產銷售,過去這幾年做這種場景化的人工智能設計,然後再去推廣。人工智能產品怎麼更成功的被市場接受,讓消費者更容易去掏錢買?如何落地和激活?為什麼這次和微軟合作語音的開發及機會在哪裡?微軟的技術怎麼獨特的激活這個市場?

雷宇:其實這兩個問題是一個問題。我們知道AI落地沒有一個通用AI可以應用到每個垂直領域,這裡面最核心的問題是如何產品化

黃學東:微軟“全武功”解決企業會議的痛點

在我們創業過程中我們發現,所有的方案只考慮技術,不考慮內容和服務。這在本質上違反了市場原則,用戶永遠要的是服務和功能,我覺得技術只是提升它的體驗,我覺得這是一個本質的問題。

我們的痛點是在通用AI技術上,沒有達到我們滿意的效果,所以我們需要和國際上最頂尖的公司進行合作。

微軟認知服務是全面性,微軟服務本身也是有機體,本身考慮的就很完善。我們和微軟的合作,因為我們看到了“明天”的東西,可以少走一些彎路,多模態和多場景的東西必然帶來很大的變革。

企業應用最後一個痛點:會議中的語音

問:微軟開發出了很好的語音識別等的技術,你們打算用這些技術開發出一些什麼樣的產品?智能音箱有很多企業都在做,但是具體的有沒有什麼更好的應用可以為大家更好的服務呢?

黃學東:語音交互過程中,在所有的商業場景中,用電子郵件、微信等等其他的產品都已經數字化了,會議中的語音是現在沒有數字化的一個主要媒體,這對生產力的提高、對消費的提高是最後的痛點。在企業的應用中,最後的一個痛點就在這個地方。

會議比較難做,不像全雙工,只有兩個人在講話,超過三個人的會議就比兩個人會議難很多。如果能做到七八個人開會,都可以轉錄和翻譯,可以變成數字化的形式處理。

問:如何看待目前的人工智能市場?

黃學東:我覺得人工智能造就的“餅”足夠大,傳統公司和新生公司都可以在這個餅上發揮自己的空間,為用戶提供更優質的服務。微軟雲是提供全球很寬泛的一個平臺,它的覆蓋力不管是全球語言還是數據中心的覆蓋力都應該是引導潮流的。在這樣一個平臺上,微軟的從計算機視覺到自然語言處理,再到語音和搜索、知識表達等服務,都是業界領導潮流的。

所以在這個平臺上和人工智能的深度上微軟有非常大的優勢,所以我們希望在提供這個寬度和深度這樣的架構下,有更多的開發商可以在這個平臺上開發出我們還沒有想到的應用,這個才是平臺做的事情。大家要知道微軟有廣度且有深度,這個情況下開發商應該加入這個平臺,在上面創造他們新的價值。

【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_3 入群;通過審核後我們將邀請進群,加入社群后務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。



分享到:


相關文章: