從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

縱觀如今的科技界,微軟是當之無愧的技術領袖。若想探尋微軟對人工智能(AI)的興趣起源,我們不得不追溯到一段頗為久遠的歷史,遠到亞馬遜、Facebook和谷歌還尚未涉足商界,更別提成為AI巨頭了。

1991年,比爾·蓋茨(Bill Gates)創建了微軟的研究部門,AI從一開始就是研究領域之一。三年後,時任微軟銷售總監的鮑爾默(Steve Ballmer)在西雅圖舉辦的全國人工智能大會(National Conference on Artificial Intelligence)上發表演講,強調了微軟對AI技術的信心。有趣的是,活動當天,鮑爾默撞壞了自己的車,他“靈機一動”提及了一個有關AI技術潛力的形象說法——希望有朝一日,軟件將智能到足以控制汽車。

鮑爾默的話在二十多年後的今天逐步逼近現實,從中也不難看出微軟研究院的高瞻遠矚。但令人費解的是,打一開始就聘用了多位計算機領域最富遠見、成就最高的科學家的微軟研究院(簡稱MSR)卻在很長的一段時間內並沒有拿得出手的創新轉化。一個顯而易見的例子是,打上世紀90年代開始,微軟就已經陸續在語音識別等研究領域取得了不菲的成績,但以上創新卻遲遲沒有對其王牌產品Windows和Office產生深遠影響。

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

2014年,由微軟(亞洲)工程院研發的人工智能助理小冰

一切的疑惑和恥辱在其CEO薩提亞·納德拉(Satya Nadella)上任五年之後一去不復返。這種改變無疑極大得益於納德拉的個人決心。拿負責微軟人工智能與研究的微軟全球執行副總裁沈向洋(Harry Shum)的話說:“從正面的角度講,薩提亞迫不及待地想要在產品中加入更多的技術。這對微軟研究院的所有人來說都是莫大的鼓勵。”這群倍受鼓舞的人涵蓋了遍佈微軟全球的——共計1000多名,分散在微軟總部雷德蒙以及波士頓、蒙特利爾、北京、班加羅爾等世界各地的——研究院計算機科學家。

但對於體量如此之大的微軟而言,“CEO的決心”所發揮的作用畢竟是有限的。讓微軟事半功倍的秘方是在複雜的後勤工作上的輕車熟路,比如確定了哪些產品應該利用哪些研究之後,還要鼓勵兩地相隔的員工在這方面進行合作,最終得保證結果的呈現,從普通員工到遊戲愛好者都是此創新的見證者。

沈向洋認為,過去外界批評微軟“沒有充分將研究人員的突破性成果進行商業轉化”實則是一種偏見。但他也不否認在所謂的“部署驅動型研究”方面,微軟確實比過去做的更好了。他說:“現在的關鍵是我們能夠以多快的速度實現這一切。”

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

沈向洋

為了更全面地瞭解微軟近年來的AI佈局,筆者最近走訪了一次微軟園區,採訪了沈向洋和公司其他部門的幾位同事,探討了“儘可能快速廣泛吸納AI技術”的話題。事實證明,這並非一個單一過程,而是一系列的複雜過程的集合體。

Office:善用會議

確保微軟的AI創新能夠造福微軟客戶,本質上就是確保研發團隊和產品團隊不會彼此孤立。這意味著,企業必須鼓勵團隊之間的交流,而微軟目前正以一種有規模、有組織的方式促進這種交流。例如,每隔六個月左右,他們就會組織一場名為Roc的活動,推動研究工作與辦公產品開發之間的跨領域交流。

沈向洋說:“我們舉辦為期兩三天的研討會,邀請來自微軟研究院的50個人和來自Office團隊的100個人,大家聚在一起。”每個人分享自己手頭上的項目,最後以黑客馬拉松活動作為收尾。

另一場交流活動就是傑出工程領導力系列講座(Distinguished Engineering Leadership Lecture Series),將負責產品的高管們帶到位於微軟園區的99號樓的微軟研究院總部。“我說,

‘你們來到這兒,必須為我做三件事。’”沈向洋說道。“首先,闡述你們的產品路線圖。第二,列出你們需要微軟研究院為你們解決的10個問題。第三點就是在你們離開這棟樓之前,承諾與我們合作開展一兩個項目。

當然,讓大家談論問題和解決方案只是一個開始。以AI技術改善微軟Office日常任務(如格式化文檔或將數據插入電子表格)的潛力是巨大的。但顯然,自動化輔助有時對用戶非但沒有幫助,還可能造成干擾。Office 97的虛擬助手Clippy就是最好的例子,它至今仍然是惹人反感、不受待見的典型技術代表。

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

“你好像在寫信,需要幫助嗎?”Clippy這句親切的“開場白”也是用戶最為反感的功能之一,畢竟誰也不想被計算機“奸視”

在根除Clippy十多年後,Office仍然想讓AI為你正在執行的任務做點什麼。只是這次它希望這種體驗是微妙的,不帶干擾性的。正如Office首席產品規劃經理羅內特•勞倫斯(Ronette Lawrence)所說,“我們的核心原則之一是確保人類永遠是主角。”

據勞倫斯透露,微軟目前為Office增加的幾乎所有功能都包含了人工智能和機器學習的元素。以PowerPoint為例,該公司希望AI成為“在雲端為你服務的設計師”。如果你使用的是配備了手寫筆的電腦(比如微軟的Surface系列)PowerPoint還能把你潦草的手寫文字和手繪形狀轉換成精美的文本。如果軟件注意到你正在輸入一系列日期,它也會提議把它們排列成時間軸。

然而,勞倫斯說,他們不會把未經請求的建議強加於你,“而是小心翼翼,輕聲表達。”PowerPoint的Design Ideas功能可以分析你手頭上的演示文檔,並在幻燈片右側以縮略圖的形式顯示可能進行的調整,比如日期序列的時間軸佈局。執行簡便,也不礙眼。


從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

例如已經在PowerPoint上線的Design Ideas功能,用戶可以利用AI技術裝飾幻燈片,但如果你不需要它,它也會小心低調,絕不擋你的路

許多Office功能依賴於微軟研究院的最新研究成果,某些“奇思妙想”更容易走出實驗室。談到demo版本的AI,勞倫斯說,“有些感覺就像科幻小說的素材,有些則感覺更接近於真實的產品。”

在Office產品團隊和MSR的某次研討會上,有人提到一個現象:用戶通常先草擬Word文檔,再填補空白處,或者交給同事填充。(但在實際操作中,我們很容易漏掉一些內容。)為啥不能讓Word文檔來輔助這個過程呢?

於是,微軟推出了一項新的“待辦事項功能”,通過掃描文檔查找諸如“TODO:獲取最新收入數據”或“在此處插入圖表”這樣的佔位符,並將其列在側邊欄中,就能提醒你記得處理未辦事宜。微軟計劃擴展這一功能,方便同事通過回覆郵件提供你所需要的元素,而不是在你的文檔裡翻找。它還打算利用AI建議相關內容。

首批獲取上述待辦事項功能的Office用戶是Windows和Mac的用戶,他們已經註冊了Office的試用項目。(它將於今年年底正式發佈。)

但在Office的常規操作中,新的AI功能通常最先出現在web端的Office版本中,其好處顯而易見——迅速面向大量用戶,快速學習並改進,無需等待傳統形式的Office新版本發佈。

“對我們來說,傾聽反饋,瞭解人們如何利用反饋訓練模型,這是非常重要的。”勞倫斯說道。“這是微軟新時代的一部分,當你發佈新功能時,我們的關注重點不再只是功能的可用性。網絡給了我們反饋機制。”

近期,微軟發佈的一組廣告裡,致力於展示Office 365服務擁有一系列別的版本所不具備的便捷功能(比如一次性付給版本Office 2019就沒有類似功能)。所有這些功能都利用了AI技術,但廣告中並未提及這一點。畢竟,人類才是主角。

遊戲:瞭解玩家

人工智能是什麼時候開始對視頻遊戲業務產生影響的?問問微軟PlayFab(該公司收購的雲遊戲開發初企)的總經理&合夥人凱文·甘米爾(Kevin Gammill),他會追溯到40年前,提到早期的電腦遊戲商,比如雅達利(Atari)街機遊戲Asteroids中的飛碟。他說:“我認為,AI存在的時間和遊戲一樣長。”


從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

塔米爾·梅拉米德和凱文·甘姆米爾

2019年,AI在遊戲中的潛在應用將遠超人們的想象。微軟在遊戲和基礎計算機研究領域都進行了大量投資,是少數有能力探索這些領域的企業之一。

這涵蓋了一些實用的AI應用,既能夠讓玩家的生活更美好,又不過分刷存在感。例如,研究表明,玩家與其他技能大致相當的玩家進行匹配,對在線競爭大有好處。甘姆米爾解釋說,“玩遊戲如果被秒殺,那大概不是好的體驗。如果對手都是‘弱雞’,這種體驗可能也不好。”Xbox Live長期使用一種名為TrueSkill(最近更新為TrueSkill 2)的算法,確保玩家不會感到無聊,也不會被對手“屠殺”。

另一個AI產品的靈感來源於這樣一個事實:“多年來,微軟遊戲玩家清楚表明,他們願意把更多時間花在玩遊戲上,而不是下載遊戲。”負責Game Pass服務的阿什利•麥基斯西克(Ashley McKissick)表示。該公司最初試圖讓玩家在下載完成之前跳過這一步驟,但這一系統需要遊戲發行商承擔大量繁重的工作,因此並未得到普遍採用。

去年夏天,微軟推出一種名為FastStart的AI增強技術,取代了這種差強人意的手工操作。它利用機器學習決定首先下載遊戲的哪個部分(下載足以使得遊戲正常運行的重要部分,並在在玩遊戲的過程中後臺安裝其餘部分),允許玩家以快達兩倍的速度進入遊戲。“我們並沒有真正改變物理定律,但下載過程確實變得更智能了。”麥基斯西克說道。

微軟正逐漸將這種協作正式化,幫助人工智能進入遊戲。他們發起了Magneto會議,與MSR/Office的Roc會議類似,旨在培養微軟研究院與遊戲團隊之間的對話和直接的黑客活動。微軟PlayFab工程部門負責人塔米爾·梅拉米德(Tamir Melamed)說:“除了這兩大陣營之外,還有來自必應、Windows和Azure的用戶。因為有很多技術我們未來都可以分享。”

其中一個聯合項目發源於微軟一年一度的全公司黑客馬拉松活動。2017年,遊戲團隊正努力應對策劃Mixer的挑戰。這是一項流媒體遊戲服務,與Twitch(一款電子遊戲直播平臺)處於同一領域,但更具互動性,微軟通過收購初創公司Beam獲取了這項直播服務。Mixer總經理查德·吉布森(Chad Gibson)說:“我們發現最終的流量比預想的要大得多。所以,我們試圖摸索‘如何才能以獨特的創新手段,讓《絕地求生》(PlayerUnknown’s Battlegrounds)或《堡壘之夜》(Fortnite)的玩家被發現?’”

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

查德·吉布森和阿什利•麥基斯西克

大約在Mixer琢磨這個問題的同時,幾位微軟研究人員贏得了黑客馬拉松比賽。他們設計了“Watch For”AI系統,可分析直播視頻流並識別其中的特定事件。(微軟十分欣賞這項技術的商業潛力,在宣佈團隊獲勝時,甚至沒有透露他們的作品究竟是什麼。)兩組人攜手合作,把Watch For作為HypeZone的基礎。HypeZone是Mixer其中一項功能,可讓觀眾在遊戲直播過程中收看最精彩的瞬間。吉布森表示,“它帶來了全新的發現形式,我們還真沒想到這些形式是可行的。”

只要遊戲存在挫折,人工智能就應該提供更多方法,減輕這些挫折。最近,甘米爾在湯姆·克蘭西(Tom Clancy)的第一人稱射擊遊戲《彩虹六號:圍攻》(Rainbow Six Siege)中,與三名好友展開了激烈的競爭。其中一名玩家的網絡連接突然中斷。甘米爾說:“我們三個人跑來跑去,另一個角色定住了,站在原地一動不動。”而定住的角色什麼也做不了,只能被殘殺。

我們可以設想一個更好的場景,那就是利用AI確定玩家的連接是否被切斷,然後臨時控制相應的角色,並以該角色的風格繼續遊戲。甘米爾說:“現在,我們距離真正實現這樣的場景已經非常接近了。”

硅“元素”:化整為零

史蒂芬·喬布斯常說,蘋果是唯一一家開發了“整套裝置”的公司,不單單是軟件或硬件,而是兩者的完美整合,以至於用戶體驗的縫隙開始消失。近年來,隨著蘋果設計了自己的iPhone和iPad處理器,並對其進行優化,以運行蘋果的軟件,這一理念得到了終極體現。

這種垂直整合對智能手機或平板電腦來說是一件好事,但放在數據中心(比如微軟Azure服務背後的數據中心)裡,恐怕未見得適用(或者說,需要整合更多)。於是乎,Project Brainwave便登場了。這是微軟利用英特爾現場可編程門陣列(簡稱FPGA)設計的定製硬件加速器,專為推動Azure雲端人工智能的加速運行。

為優化人工智能而自主設計硬件並非微軟獨創。出於類似的原因,谷歌和亞馬遜也在從軟件向硅(硬件)轉移。但微軟並不是隨波逐流。將近十年前,道格·伯格(Doug Burger)開始思考一個機會,Project Brainwave就是他最終的思想結晶。當時,伯格是微軟研究院的一名研究員。起初,他獨力承擔這個項目。據他回憶,“我在2010年開始這項工作,大概一年後,我把它交給了管理層。”

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

Project Brainwave源於微軟意識到,採用AI技術需要從芯片層面開始

傳統芯片離廠時能夠執行其指令庫中的計算指令,且永遠無法針對其他用途進行重新培訓,比如高效運行一套新的機器學習算法。相比之下,伯格說,FPGA就像變色龍。他解釋道:“FPGA允許我們快速構建內容並將其投入生產,然後以非常快的節奏進行迭代。就像變色龍能夠快速變換顏色,而且每次變色都在進步。”

FPGA技術允許微軟提供高效的深度學習服務,滿足特定的客戶需求。Azure機器學習高級項目經理泰德·維伊(Ted Way)指出,“他們希望解決的很多問題都與圖像分析有關。‘我想了解我在製造方面的缺陷。’‘我想查查產品是否缺貨。’‘我想看看是否有人在我的加油站抽菸,我擔心發生火災。’道格的團隊扭轉了這一局面,只用了大約6個月的時間,就在FPGA上構建了這些卷積神經網絡,運行速度非常快。”按照硅的標準衡量,這的確很快。

2010年,當伯格開始針對FPGA開展個人調查時,人們還不清楚AI能以多快的速度走向主流,更料想不到像微軟這樣的公司會把提供AI服務來作為一項戰略要務。畢竟,並非人人都是具有先見之明的計算機科學家。很快,微軟就瞭解到伯格的創意能為Azure帶來怎樣的價值。去年7月,Project Brainwave走出了實驗室,伯格及其團隊也離開了MSR。今天,他們作為Azure團隊的一份子,繼續研究工作。

從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

微軟技術研究員道格·伯格手持Azure數據中心使用的經過人工智能優化的Project Brainwave加速器。

這種過渡並不少見。伯格表示,“今天的微軟文化有一個特點,那就是研究和產品之間的界限已經模糊了許多。產品團隊中有很多人曾經是研究員,現在正在開發新產品。研究團隊裡不僅有做研究的人,也有製造產品的工程師。它更像是一個統一連續體。”接著,他又補充說,納德拉“在推動這類創新方面做得很好。”

智能自助:由己及彼,乃至更多

通過Azure,微軟正在與亞馬遜和谷歌展開競爭,為各種類型的企業提供按需服務,包括人工智能和其他高級計算功能。這不僅對外部公司有利,微軟內部也有一些團隊能夠從預先打包的AI和機器學習中獲益。

Codie就是一個很好的例子。它是一個多語言聊天機器人,其用途是提供有關編程的信息。但目前還只是一款試驗型產品,未能商業化。它的誕生源於微軟工程師意識到:對於想要成為軟件工程師的人來說,主要障礙之一就是如何獲取Python編程語言中的指令和SQL數據庫查詢語法等事項的相關信息。尤其是對非英語母語的人而言,這個障礙會更大。

對於工程師們而言,Codie服務就相當於“微軟小娜(Cortana)的極客妹妹”,Office 365和Microsoft 365的高級數據分析經理、是Codie的創始人之一馬特·費舍爾(Matt Fisher)解釋道。這項服務它誕生於微軟車庫項目,此項目鼓勵員工追求自己熱衷的想法,併為其提供所需資源,無論這些想法是否完全屬於員工的正式職責。創建該服務的團隊中有15名來自不同背景的員工,包括開發人員、設計師和營銷人員。Codie擊敗了其他767個項目,贏得了微軟的雷德蒙科學博覽會(Redmond Science Fair)比賽,並在該公司的包容性挑戰中與5875份參賽作品角逐,最終斬獲第二名。


從研究到產品,不惑之年的微軟如何從谷底重回巔峰?

阿夫琳·拉赫曼和馬特·費舍爾

Codie從微軟必應搜索引擎和用戶對用戶的技術諮詢站點Stack Overflow獲取信息,使用文本輸入形式回答編程相關問題。“48小時內,我們開發出了這樣一款產品,它跨越了五門不同的口頭語言,從一個龐大的數據庫提取信息。你可以用西班牙語問它一個編程問題,然後得到一個西班牙語的技術性解答。”阿夫琳·拉赫曼(Afreen Rahman)說道。拉赫曼的正職是軟件工程師,負責Microsoft Store。

Codie的創始團隊為企業帶來了各種各樣的技能,但他們一開始對人工智能瞭解得並不多。拉赫曼說:“我們使用了微軟提供的AI套裝中的現成工具。作為開發者,我們能夠在短時間內找到文檔並開始工作。”

費舍爾對於支持Codie的微軟雲產品爛熟於心:“我們使用了從Azure學習服務到LUIS語言理解等一切產品。QnA Maker、必應圖譜、微軟圖譜、Azure機器人框架、Azure語音插件。”這裡涉及了大量微軟的AI專業知識,只不過都是現成的知識。對Codie和大家想要構建的其他許多項目來說,這些就夠用了。

在把人工智能作為一項實現激勵目標的技術方面,Codie已經取得了成功。它的創造者正在考慮升級(比如讓用戶直接說話,取代打字)和普及問題。費舍爾說:“我們的目標是看到它在微軟的圍牆之外得到運用。大家正在朝著需要做的方向努力。我們得到了Garage這個可愛團隊的支持,但對很多人來說,這是我們的第二或第三份工作。”

創新方法論:現實問題,現實研究

關於微軟研究和產品團隊的交流新方法,還有一點值得關注,即受益的不僅僅是產品。對於訓練機器學習算法所需的數據,人工智能有著無法滿足的胃口。作為全球最大的科技公司之一,微軟擁有以公噸為單位的匿名數據。這意味著,即使曾經有那麼一段時間,微軟在其研究成果和服務於人類的賺錢業務之間築起了一道高牆,並從中受益,那這個時期也已經結束了。

“今時今日,要從事大量激動人心的AI研究,你需要接觸真實的問題,你需要獲取數據。”沈向洋說道。“此時,你得和產品團隊相互配合。你建立一個新模型,訓練這個新模型,然後調整你的新模型。現在,你的基礎研究更進了一步。在這個過程中,你沒準就能取得突破。”


分享到:


相關文章: