05.31 微軟大秀AI肌肉:彰顯的不僅是力量更是格局

1995年,微軟公司創始人比爾·蓋茨親筆撰寫的《未來之路》一書成為暢銷書,並被評為“新中國成立50年最有影響的100部圖書”之一。這本書中滿是比爾·蓋茨對未來的預言。時至今日,包括智能手機、視頻會議、在線音樂等在內的多個預測都已經成為現實。

今天,人工智能技術撲面而來,微軟推出的《未來計算:人工智能及社會角色》一書則從人工智能的未來,負責任地使用人工智能的原則、政策和法律,以及人工智能與職業和工作的未來等三個方面進行深入剖析,並創造性地提出了人工智能開發的六大原則:公平、可靠和安全、隱私和保障、包容、透明、責任。

相比較比爾·蓋茨天馬行空又不失真實的預言,由微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人沈向洋與微軟總裁及首席法務官施博德共同撰寫的這本書更像是一本人類邁向人工智能時代的教科書,教給我們如何更好地運用這一新技術。在筆者看來,這本書充分體現了微軟作為人工智能領域領導者,對於人工智能技術發展,以及如何讓人工智能等新技術為社會創造更多福祉等問題的深刻思考。

眾所周知,一家企業只有真正成為行業領導者,才能掌控行業話語權。在人工智能領域,微軟作為話語權的擁有者,如何做好這個領域的引領者?在日前首次在中國召開的2018微軟人工智能大會上,微軟不僅將自身在人工智能領域的能力進行了全方位展示,還在大秀肌肉的同時,充分展現出一家領導企業應有的格局。

微軟大秀AI肌肉:彰顯的不僅是力量更是格局

沈向洋 微軟全球執行副總裁、微軟人工智能及微軟研究事業部負責人

從Azure到AI 平臺技術與服務才是核心發力點

作為微軟人工智能領域的大咖,沈向洋、郭昱廷、黃學東等在微軟工作已經超過二十年,在過去二十年間,他們在微軟所從事的工作多多少少都與人工智能相關,這也是今天微軟能夠牢牢抓住人工智能話語權的根本。很多時候,人們都只看到了微軟在AI領域的成績,卻未曾看到在這些成績背後持續多年的鉅額投入。

如今,AI再次成為業界關注的焦點領域,第一次顯現出徹底改變世界的潛質,這一天,微軟雲計算與人工智能事業部全球資深副總裁郭昱廷已經等了20多年,在他的記憶裡,上世紀80年代是AI的上一個春天,可直到上世紀90年代初,AI領域還沒有出來像樣的成果,行業的冬天隨之降臨,直至今日。

郭昱廷認為,今天的人工智能能夠再次呈現爆發式增長,得益於三大要素的出現:首先,大數據時代的到來;其次,雲計算的興起;第三,算法的發展。大數據和計算能力的疊加,再加上強大算法的配合,AI迎來了真正的春天。

微軟近幾年的發展恰恰印證了這一說法,自微軟全面發力雲計算領域至今,微軟智能雲Azure已覆蓋全球50多個區域,並且獲得了不同地區的超過70項安全合規認證,逐漸成為“世界的計算機”。不僅如此,Azure在發展過程中也在不斷彙集微軟在人工智能領域多年的技術積累,並發展成為開發、部署、運行人工智能的最佳雲平臺。

這恰恰是微軟給自己在雲計算與AI領域的定位:專注於打造平臺技術與服務。事實上,早在上世紀90年代微軟成立研究院時,就確定了多個圍繞AI展開的研究項目,包括計算機視覺、語音識別、自然語言識別等。

微軟大秀AI肌肉:彰顯的不僅是力量更是格局

黃學東 微軟全球資深技術院士,微軟雲與人工智能事業部

微軟雲與人工智能事業部全球資深技術院士和首席語音科學家黃學東作為相關領域帶頭人,一直推動語音識別、自然語言處理等技術的創新與發展,並取得了一系列進展:2016年,微軟率先實現語音識別系統5.9%的低錯誤率;2017年8月,微軟在Switchboard語音識別基準測試中的錯誤率已經降低至5.1%,這一水平足以媲美人類專業速記員;

2018年1月,微軟亞洲研究院自然語言計算組率先在斯坦福大學發起的SQuAD文本理解挑戰賽上獲得超越人類的分數;2018年3月,微軟研發的機器翻譯系統在通用新聞報道測試集newstest2017的中-英測試集上,第一個達到了可以與人工翻譯媲美的水平……

執著於技術研發和創新的微軟並沒有將成果視若珍寶,輕易不主動示人,反而不斷推動這些平臺技術的開放。早在兩年前的Build 2016微軟全球開發者大會上,微軟就首次公佈了運行於Azure的認知服務,以API的形式為開發者提供觸手可及的人工智能。微軟在全球推出了覆蓋語音、視覺、語言、機器翻譯等功能的24項服務,目前已經有超過100萬開發者使用認知服務。

這也恰恰印證了微軟給自己賦予的使命:予力全球每一人、每一組織,成就不凡。

開放合作共享 AI生態賦能者將是主要角色

在此次微軟人工智能大會上,來自南京工業大學的碩士研究生宋昊旻與沈向洋在現場藉助人工智能技術上演了一次震撼卻又充滿溫情的對話。原本因為小時候用藥不慎造成神經性聽力損失的宋昊旻,雖然能夠像常人一樣發出聲音,但他的語音、語調則會顯得有些吃力和不自然。

這種情況對於和普通人溝通或許並非難事,但對人工智能卻是一個大挑戰。為此,基於Microsoft Translator打造的微軟語音服務,專門針對宋昊旻的聲音特點定製了語音識別模型,能夠以極高的準確度將他的語音實時轉換成文字,還能同步翻譯成英語或其它語言,從而真正實現了宋昊旻與沈向洋的無障礙溝通。

同樣是基於Microsoft Translator,小米生態鏈企業香蕉出行推出了魔芋AI翻譯機,一時間成為出境遊遊客爭相購買的爆款。據香蕉出行合夥人及CTO於亮介紹,魔芋AI翻譯機能夠提供多達14種語言的實時語音翻譯,讓多個不同語言的人可以藉助這一設備實現自由交流。

如果說魔芋AI翻譯機是一款針對普通消費者的產品,那麼微軟全球首創的AI會議系統則稱得上是一款“辦公神器”。在黃學東的現場演示和介紹中,這款“神器”可以用人工智能同時記錄多人會議的語音和圖像、對不同人的發言進行標記和語音轉寫、分開歸檔並提取會議重點議題或摘要。

對此,黃學東表示:“谷歌前不久推出的全雙工語音通話,無非能讓兩個人自由的講話。而我們這個系統不僅能支持兩個人講話,還能支持三個人、四個人、五個人講話,真正做到了‘眼觀六路耳聽八方’,我更願意稱它是‘全武功’。”

不僅如此,這款神器還擁有微軟所開發的麥克風陣列開發系統,能大幅提高遠場語音識別的能力;再加上360度的攝像頭和Microsoft Translator,堪稱是微軟各種黑科技的集大成者。

微軟大秀AI肌肉:彰顯的不僅是力量更是格局

不過,這款產品並非完全由微軟打造,而是微軟與Roobo聯合研發的產物。據Roobo合夥人兼CTO雷宇介紹,基於微軟語音團隊聯合Roobo共同研發的多MIC語音開發板MSDDK(Microsoft Speech Device SDK),ROOBO完成MSDDK在音頻,聲學及硬件的設計與實現,並且由ROOBO直接向開發者提供硬件,而微軟則提供Speech Service開發平臺。

從表面上看,這是一個AI會議系統,但這些技術的組合完全可以應用於更多的工作和生活場景。正如雷宇所說,它不僅提供了極致的體驗,更重要的是重新定義了交互,相當於推動人工智能進入“智能機”時代。

百芝龍作為一家專注於研發基於家庭場景下可預測用戶行為和需求的人工智能服務系統的企業,他與微軟的合作模式與香蕉出行、Roobo等企業頗為相似:微軟提供底層技術,扮演平臺技術和服務提供商,他們則在這些底層技術的基礎上開展人工智能的應用創新。

微軟大秀AI肌肉:彰顯的不僅是力量更是格局

​正如百芝龍CEO葉偉所說,作為一家應用層的企業,公司不可能再花二三十年重新研發AI底層的技術,與微軟的合作恰好可以發揮各自的優勢。首先,微軟在AI領域已經有二三十年的積累;其次,微軟只做裁判員不做運動員,不會與合作伙伴爭利。在這種情況下,百芝龍只需要做好自己在應用層該做的事情即可,即便在技術上碰到一些問題,還可以通過與微軟的合作,共同解決。

從上述這些案例可以看出,面對不同的合作伙伴,微軟所扮演的角色都是類似的:在AI這樣一個大的生態系統中,微軟要做的事情其實就是把底層的技術和平臺做好,並將其開放出來,為不同的合作伙伴賦能,從而激發AI的活力,切實推動人工智能的普及應用。這與微軟公司的使命可謂一脈相承。

從操作系統生態到AI生態 巨頭的華麗轉身

兩個月前,微軟對自身的組織架構做出了全新調整,成立了“體驗和設備”部門(Experiences & Devices org)和“雲與人工智能”平臺(Cloud + AI Platform),而Windows和設備部門(Windows and Devices Group)則被拆解。

原本隸屬於人工智能與研究事業部的郭昱廷在這次調整中也轉到了新的雲計算與人工智能事業部,“這樣的變化也體現出微軟在人工智能領域的決心。”郭昱廷強調。

在筆者看來,這既是微軟對過去的告別,也是微軟對未來的擁抱。其中,告別指的是向傳統的操作系統生態告別;而未來則是對新的人工智能生態的擁抱。不可否認,在PC時代,微軟構建的以Windows為核心的生態系統造就了今天的微軟;但在新的人工智能時代,Windows已經完成了它的歷史使命,微軟需要走向下一站——人工智能。

有趣的是,如今微軟要打造的人工智能生態與曾經的操作系統生態有著明顯的區別:操作系統生態時代,微軟是一家獨大,而且操作系統的開放程度也沒那麼強;但在人工智能生態時代,微軟則專注於底層技術研發,將應用完全交由合作伙伴完成,這無疑將進一步推動人工智能生態的繁榮。

在這一過程中,微軟不僅是賦能者,也是被賦能的一方;微軟為合作伙伴提供底層技術和平臺,合作伙伴在基於它們開展應用創新時,又會反過來促進微軟對底層技術和平臺進行持續優化。如今,這樣一個良性循環正在形成,受益的不僅是微軟和它的合作伙伴,更是整個人工智能領域。


分享到:


相關文章: