曾經輝煌的雅虎研究院

曾經輝煌的雅虎研究院

雅虎是最早成功的互聯網公司之一,也是最早意識到需要把基礎研究,特別是機器學習以及人工智能研究,應用到實際產品中的公司。雅虎從很早就開始招聘和培養研究型人才,雅虎研究院就是在這個過程中應運而生的。

今天我就來說一說雅虎研究院的歷史,以及過去十多年間取得的成就,聊一聊如何通過引進高級人才,迅速構建起一支世界級的研發團隊。當然,也會聊一聊研究院的衰落。高級研發機構對於企業而言往往是錦上添花的事情,在整個公司產品和視野都欠缺的情況下,也往往避免不了最後衰敗的結局。

雅虎研究院的創立

雅虎研究院的故事要從一個叫烏薩馬·菲亞德(Usama Fayyad)的人說起。烏薩馬出生在北非突尼斯的迦太基(Carthage),早年在突尼斯以及其他地中海沿岸國家度過,包括中東、非洲以及南歐的一些國家。高中時期在約旦的安曼生活,後來在美國密歇根大學度過了他的本科(1984 年)、碩士(1986 年)以及博士(1991 年)生涯。畢業之後,烏薩馬來到了美國加州南部隸屬於美國國家航空航天局(NASA)的噴氣推進實驗室(Jet Propulsion Laboratory)工作,一直到 1996 年。之後加入微軟研究院,從事數據挖掘的研究工作。

早在 1994 年,烏薩馬就和拉馬薩米(Ramasamy Uthurusamy)一起組織了最後一屆 KDD 研討班,然後在 1995 年,他們把這個研討班升級成了會議,並在加拿大蒙特利爾舉辦了第一屆 KDD 大會(First International Conference on Knowledge Discovery in Data)。從此,KDD 大會成了數據挖掘、數據科學以及應用機器學習的頂級會議。

1996 年,烏薩馬又創辦了一本叫《數據挖掘和知識發現》(Data Mining and Knowledge Discovery)的學術期刊,並親自擔任主編。這本期刊也漸漸成了數據挖掘領域主要的學術期刊之一。烏薩馬本人可以說在 20 世紀 90 年代中期,就已經開始成為數據挖掘領域重要的領軍人物。

進入 21 世紀,烏薩馬先是在 2000 年創立了一家叫 Audience Science 的數據挖掘公司並擔任 CEO,然後又在 2003 年創立了一家叫 DMX Group 的數據挖掘諮詢公司,後者於 2004 年被雅虎收購。不久後,他成為雅虎的執行副總裁以及首席數據官(Chief Data Officer),這也是互聯網歷史上的第一位首席數據官。

因為雅虎在搜索以及廣告業務上的擴展,烏薩馬意識到應該成立一個類似於微軟研究院,但更偏向於互聯網業務的研究組織,這個想法得到了公司 CEO 楊致遠的支持。烏薩馬當時的首要任務是為研究院物色一位院長。

經過一段時間的尋找,他成功邀請到普拉巴卡·拉加萬(Prabhakar Raghavan)來擔綱。今天回頭來看,普拉巴卡無疑成功地引領了雅虎研究院,並讓其一度成為人人嚮往的互聯網研究機構。當然,這跟普拉巴卡本人的經歷也密切相關。

首先,他本人就是知名的學者,參與撰寫的經典教科書《隨機算法》(Randomized Algorithms)和《信息檢索導論》(Introduction to Information Retrieval)在學術界享有盛譽。他還是 ACM、IEEE 的院士,也是美國工程院院士,這為他招納學術界權威人士和博士生提供了便捷。加入雅虎之前,他已經在 IBM 研究院以及 Verity 任職多年,IBM 的從業經歷更是讓他對企業文化和工業界的研究機構有了很深的瞭解。

2005 年 7 月,雅虎研究院正式成立,普拉巴卡擔任研究院負責人,向烏薩馬彙報。2008 年,雅虎研究院與之前就在搜索與廣告事業部存在的應用科學部門合併。在卡羅爾·巴茨(Carol Bartz)任職 CEO 期間,普拉巴卡直接給她彙報,並且普拉巴卡還曾擔任首席戰略官。

雅虎研究院的蓬勃發展和輝煌

雅虎研究院組建之後,首要任務當然就是吸引工業界和學術界的知名學者,從而能夠組建一個有效的團隊。普拉巴卡利用他個人和烏薩馬的聲望,很快就做到了這點。

比如,之前和普拉巴卡在 IBM 共事的安德魯·湯姆金斯(Andrew Tomkins)加入團隊,擔任負責搜索的首席科學家以及搜索方面的副總裁(安德魯後於 2009 年之後加入谷歌擔任工程總監)。 再比如,曾和普拉巴卡在 IBM 共事的安德烈·布羅德(Andrei Broder)2005 年加入團隊,擔任負責計算廣告方面的副總裁。

安德烈本人大有名頭。他在斯坦福大學攻讀博士期間師從圖靈獎得主高德納(Donald Knuth),然後在曾經名噪一時的第一代搜索引擎公司 AltaVista 擔任首席科學家,之後加入位於紐約的 IBM 研究院組建企業級搜索平臺。和普拉巴卡一樣,安德烈也是 ACM 和 IEEE 的雙料院士。2012 年安德烈加入谷歌,擔任傑出科學家 (Distinguished Scientist)。

我們這裡簡單列舉一些曾經在雅虎研究院工作過的知名學者,我們便可一覽其盛況:

  • Ronald J. Brachman:哈佛大學計算機科學博士,加入雅虎研究院之前長期于貝爾實驗室工作,曾擔任貝爾實驗室人工智能研究部的負責人。1996 年之後擔任 AT&T 實驗室通信服務研究中心副總裁。2005 年加入雅虎研究院協助普拉巴卡進行管理,並於 2012 年到 2016 年間擔任雅虎研究院首席科學家以及負責人。Ronald 曾任 AAAI 主席。2016 年之後擔任紐約康奈爾科技大學的 Jacobs Technion-Cornell 研究院院長。

  • Yoelle Maarek:以色列理工大學計算機科學博士,加入雅虎研究院之前曾任 IBM 研究院的傑出工程師和谷歌的工程總監。歷任雅虎研究院以色列分部的負責人、高級研究總監,並在 2016 年 Ronald 離開之後任雅虎研究院的負責人。

  • Jan Pedersen:斯坦福大學統計學博士。2002 年加入 AltaVista 擔任首席科學家(在安德烈之後)。2003 年加入雅虎研究院擔任搜索和廣告方面的首席科學家(在安德魯·湯姆金斯之前)。2009 年加入微軟,擔任 Bing 核心搜索部門(Core Search)的首席科學家。2017 年加入 Twitter,擔任數據科學副總裁。

  • Ben Shahshahani:普渡大學電氣工程博士。曾在 Nuance Communications 擔任工程總監。2005 年加入雅虎研究院,之後歷任負責搜索廣告的高級總監以及搜索與媒體科學組的副總裁。2012 年加入谷歌任工程總監。2014 年回到雅虎,任廣告科學方面副總裁。

  • Ricardo Baeza-Yates:滑鐵盧大學計算機科學博士,ACM 和 IEEE 雙料院士,信息檢索和搜索方面的權威,著有《現代信息檢索》( Modern Information Retrieval)一書。他在雅虎研究院擔任拉美和歐洲分部的副總裁直至 2016 年,也是智利科學院以及工程院的院士。

  • Ravi Kumar:康奈爾計算機科學博士,加入雅虎研究院之前在 IBM 研究院從事數據挖掘算法的研究。2005 年加入研究院之後擔任首席研究科學家。2012 年加入谷歌擔任高級主任研究科學家(Senior Staff Research Scientist)。他的論文引用數達 3 萬次以上。

  • Evgeniy Gabrilovich:以色列理工大學博士,在雅虎研究院擔任首席研究科學家,並且擔任自然語言處理方向研究的負責人。2012 年加入谷歌擔任高級主任研究科學家。2012 年當選 ACM 傑出科學家(ACM Distinguished Scientist)。

  • Deepak Agarwal:康涅狄格大學(University of Connecticut)統計學博士,加入雅虎研究院之前在 AT&T 擔任高級研究科學家一職。2006 年加入雅虎研究院擔任首席研究科學家,主要研究推薦系統相關的內容。2012 年加入 LinkedIn,擔任人工智能和機器學習方面的副總裁。

  • Alexander Smola:柏林理工大學計算機科學博士,加入雅虎研究院之前任澳大利亞國立大學教授。2008 年加入雅虎研究院後任首席研究科學家(Principal Research Scientist)。2013 年加入卡內基梅隆大學任教授一職。2016 年加入亞馬遜擔任機器學習方面的總監。他的論文引用數達 8 萬次以上。

  • Jianchang (JC) Mao:密歇根州立大學計算機科學博士,加入雅虎研究院之前曾在 IBM 研究院任職,還曾擔任 Verity 的首席軟件架構師。2004 年加入雅虎之後任廣告科學方面副總裁。2012 年加入微軟之後,先後擔任 Bing 的多個職務並於 2016 年被提升為公司副總裁。他的論文引用數達 1 萬次以上。

  • Raghu Ramakrishnan:德克薩斯大學奧斯汀分校計算機科學博士,加入雅虎研究院之前擔任威斯康星大學教授。2006 年加入雅虎研究院之後任雲計算方面的副總裁。2012 年加入微軟之後一直擔任 CTO,負責雲計算領域。他的論文引用數達 3 萬次以上。

當然,在雅虎研究院工作過的知名人士還有很多,這裡無法一一列舉。不過我們可以看出,不少人在離開雅虎之後,依然在業界發揮著不小的作用。

除了招攬到一批優秀人才,雅虎研究院也發表了一系列有價值的研究成果,在很短的時間內建立了學術研究上的威望。在 10 年間,據不完全統計,雅虎研究院的學者獲得過兩次信息檢索頂級會議 ACM SIGIR 的最佳論文、3 次數據科學和數據挖掘頂級會議 ACM KDD 的最佳論文、兩次機器學習頂級會議 ICML 的最佳論文、兩次推薦系統頂級會議 ACM RecSys 的最佳論文、兩次信息檢索以及網絡信息挖掘的權威會議 ACM WSDM 的最佳論文、兩次信息檢索和數據庫領域頂級論文 ACM CIKM 最佳論文以及一系列有影響力的最佳論文獎項,涵蓋了搜索、廣告、推薦系統、數據挖掘、機器學習、人機交互等諸多方面,為互聯網研究和發展做出了重大貢獻。

可以說在非常短的時間內,雅虎研究院就用卓越的研究成果向世人證明了這個團隊和組織的實力。曾經在某一段時期內,世界各國的優秀研究人員和博士畢業生都希望躋身雅虎研究院的研發隊列。

雅虎研究院逐漸成為歷史

2012 年是雅虎歷史上格外動盪的一年。先是公司 CEO 卡羅爾·巴茨在上一年的 9 月份被董事會解僱;然後經歷了短暫的臨時 CEO——蒂姆·莫爾斯(Tim Morse);之後新 CEO 斯科特·湯普森(Scott Thompson)在 1 月上任,5 月份就因學歷造假醜聞離職;羅斯·萊文索恩(Ross Levinsohn)之後擔任公司臨時 CEO 直至 7 月。然後,瑪麗莎·梅耶爾(Marissa Mayer)加入公司擔任 CEO。短短不到一年的時間裡,共有 5 個人擔當了 CEO 的職位。

在這個過程中,普拉巴卡離職並加入谷歌,很多之前追隨他的人也先後加入谷歌。普拉巴卡離開後,羅納德·布拉赫曼(Ronald J. Brachman)接過了研究院領導人的位置,並在 2012 到 2016 的 4 年間為瑪麗莎重新招募了超過 100 名博士科學家。

2016 年 2 月,雅虎宣佈研究院不再作為一個獨立實體而存在,羅納德離職,所有研究人員被分散到各個工程部門,依然保留雅虎研究院的對外旗號,耶艾爾·瑪瑞克(Yoelle Maarek)擔任負責人。2017 年雅虎和 Verizon 合併,雅虎作為一個獨立的公司成為歷史。

雅虎研究院逐漸淡出歷史舞臺,這固然有公司高層頻繁更換的原因,也有一些更加深層次的原因。研究院的成果往往都需要一定時間才能直接在產品中體現出來,因此,雖然在技術上研究院能夠幫助公司提升水平,但是實際產品的效果未必就一定能夠受到用戶的青睞。

例如,研究院曾經投入了大量人力物力,利用機器學習來提高搜索引擎的搜索品質。可以說,雅虎是最早將人工智能和機器學習技術大規模應用在搜索引擎上的公司。但是搜索引擎的好壞很多時候是一個產品、技術、設計的綜合體現,雅虎研究院研發的算法並沒有在產品的綜合表現中掙得額外加分。

相似的例子還包括雅虎研究院在早期就投入了很多力量研發廣告平臺,甚至包括安德烈·布羅德本人到斯坦福大學開設了世界歷史上第一門計算廣告學的課程。然而,雅虎整個平臺的產品都在下滑,因此廣告平臺受到了額外的壓力。雖然研究院的科學家們在算法和模型上做出了很多創新,也在一定時間內帶來了不小的收益,但都無法改變整個公司產品線運營不佳的情況。於是,雅虎研究院的成果在雅虎整體業績不理想、公司產品缺乏想象力的大背景下顯得杯水車薪,並不能從整體上扭轉公司的頹勢。在公司進入動盪之後,研究院對於高層領導來說,往往也就不是公司的重點發展對象了,研究院的瓦解也就成了必然。

小結

今天我為你分析了雅虎研究院的興衰。一起回顧下要點:首先,雅虎研究院曾通過引進高級人才的方式,迅速構建起了一支世界級的研發團隊,並發表了一系列有價值的研究成果,建立起在學術研究上的威望,創造了研究院曾經的輝煌;其次,因高層變動以及一些深層次的問題,雅虎研究院沒有擺脫最後衰落的結局,一切輝煌終成歷史。

數據科學家系列,微信公眾號:小鳥編程


分享到:


相關文章: