吳軍:Google 中日韓文搜索算法的主要設計者,因《浪潮之巔》享譽業界|CNCC 2018

雷鋒網 AI 科技評論按:作為一位計算機科學家,吳軍博士有兩個最為人所知的身份,一是他是當前 Google 中日韓文搜索算法的主要設計者,曾一度為 Google 貢獻了整個代碼庫 0.7% 的代碼;另一是他的作家身份,他在《浪潮之巔》一書中,以對世界 IT 產業高屋建瓴的視角和深入淺出的剖析,而享譽業界。

在 10 月 25 日—27 日杭州國際博覽中心(G20 會場)舉行的 2018 中國計算機大會(CNCC 2018)上,吳軍博士將蒞臨現場圍繞「大數據推動數字經濟」這一話題展開演講。

吴军:Google 中日韩文搜索算法的主要设计者,因《浪潮之巅》享誉业界|CNCC 2018

吳軍博士,是著名自然語言處理和搜索專家,他畢業於清華大學(本科、碩士)和美國約翰·霍普金斯大學(博士),在校期間,吳軍博士致力於語音識別、自然語言處理,特別是統計語言模型的研究,曾獲得 1995 年全國人機語音智能接口會議的最佳論文獎和 2000 年 Eurospeech 的最佳論文獎。目前,吳軍博士已在國內外發表過數十篇論文,並獲得和申請了十餘項美國和國際專利。

對於吳軍博士的身份,需用「多樣化」這個詞來形容——Google 中日韓文搜索算法的主要設計者、前騰訊搜索業務副總裁、硅谷風險投資人、約翰·霍普金斯大學工學院董事會董事、中國工業和信息化部的專家顧問、創業導師以及暢銷書作家等等。

在計算機科學這個領域,相對於其他科學家而言,吳軍博士的身份可能會少了些「學術」而多了些「實幹」。事實上,對於學術界和工業界的抉擇,吳軍博士一開始就有了很明確的答案:工業界離人的生活更近。他在人物 LIVE 2016 年的一次採訪中表示:「十年前 Google 搜索的老大,現在是美國工程院院士的阿米特辛格和我講,我們的算法都應該是前所未有的,我們的每一個程序在全世界都有上億的人在用,我們在創造、在改變世界。」

Google 中日韓文搜索算法的主要設計者

2002 年博士畢業後,吳軍博士就加入了 Google,不久後就與 Amit Singhal(美國工程院院士,世界著名搜索專家)、Matt Cutts(Google 反作弊官方發言人)等同事一起開創了網絡搜索反作弊的研究領域,並因此獲得 Google 工程獎。

2003 年,他又和 Google 全球架構的總工程師朱會燦博士等共同成立了中日韓文搜索部門,成為 Google 中日韓文搜索算法的主要設計者。之後,他繼續領導了許多研發項目,包括許多與中文相關的產品和自然語言處理的項目,得到了公司首席執行官埃裡克·施密特的高度評價。

雖然在 2010-2012 年,吳軍博士離開 Google,出任騰訊搜索業務的副總裁——此期間還擔任國家重大專項「新一代搜索引擎和瀏覽器」項目的總負責人,然而,也許是吳軍博士註定與 Google 有某種難以切割的緣分,2012 年,他又回到 Google,負責開發了 Google 自動回答系統——而他也因為這個項目發現了一片新天地。

根據圖靈的觀點,當機器可以回答人的問題而提問者無法判定回答問題的是機器還是人時,機器就有了和人同等的智能。這要求計算機不僅能夠識別人的語音,還能回答人的提問,但是直到 2012 年,機器自動回答複雜問題(如「為什麼」和「怎麼辦」)在學術界依然被認為是一個尚未解決的難題。

2012 年,吳軍博士在 Google 領導的研究小組開始著手解決這個問題,到 2014 年年初,Google 的搜索引擎已經能夠回答 30% 的複雜問題了,這遠遠超過了當時學術界同類研究的水平。針對這一重大成果,吳軍博士在《電信科學》上發表的一篇詳細講述機器智能前世今生與未來影響的綜述論文《大數據和機器智能對未來社會的影響》中提到,「除了 Google 在自然語言處理等基礎算法上做到了世界領先之外,更重要的是 Google 將這個過去認為是自然語言理解的問題變成了一個大數據的問題。」

另外,值得一提的是,在 Google 任職期間,吳軍博士頂峰時期寫的代碼一度佔 Google 整個代碼庫的 0.7%——對於絕大部分 Google 的工程師來說,這是個難以超越的數字。

曾渴望用算法和代碼屹立世界之巔,如今選擇用文字去影響世界

而跨界成為作家這一事情,則頗有些陰差陽錯的意味。吳軍博士表示:「我沒有作家夢,要說是什麼原因導致,就是一開始我寫黑板報,寫完以後很受歡迎,就接著寫下去了。」

2007 年,時任 Google 資深研究員的吳軍博士,應邀為 Google 黑板報撰寫文章,隨後 Google 黑板報人氣大增,擁有了大批追隨者。

李開復便是其中的追隨者之一,他對吳軍博士做出了非常高的評價:「在我認識的頂尖研究員和工程師裡,吳軍是極少數具有強大敘事能力和對科技、信息領域的發展變化有很深的縱向洞察力,並能有效歸納總結的人之一。」

此後,他為 Google 黑板報撰寫的內容彙集成了兩本書:《浪潮之巔》和《數學之美》。《浪潮之巔》以對世界 IT 產業高屋建瓴的視角和深入淺出的剖析,引發了 IT 人員對 IT 產業的深層思考,被譽為「在這個數字時代,一本 IT 人非讀不可,而非 IT 人也應該拜讀的作品」,並且榮獲了「藍獅子 2011 年十大極佳商業圖書」獎;《數學之美》則把高深的原理講得更加通俗易懂,讓非專業讀者也能領略數學的魅力,該書榮獲國家圖書館第八屆文津圖書獎以及第五屆中華優秀出版物獎。此外,吳軍博士也因《浪潮之巔》被 CSDN、《程序員》雜誌評選為 2011 年度十大最具技術影響力人物之一,享譽業界

曾渴望用算法和代碼屹立世界之巔的吳軍博士,如今則選擇用文字來影響世界。《浪潮之巔》和《數學之美》之後,吳軍博士又基本以每年一本的節奏出版了《文明之光》(被評為 2014 年「中國好書」)、《硅谷之謎》、《大學之路》、《智能時代》、《見識》等圖書,在「豆瓣網」上,本本評分都在 8.4 分以上,其中,《浪潮之巔》和《文明之光》更是高達 9.3 分和 9.0 分。

而在《文明之光》中,吳軍博士則表達了對科技和人文的深刻認識。他在書中表示:「它們不是排斥的關係,只是看問題的不同側面。從歷史上講,科學與人文都是在早期反對宗教、反對神學的基礎上發展起來的。科技是唯一一個後人可以做得比前人好的東西,這是大家公認的——可以說,人類之所以能不斷進步,動力就源於一些基本的發明創造、科技進步。但另一方面,科學只是工具,不是目的,它不能解決所有的問題,而人文則在文明中起到決定性作用,它決定了文明發展的方向。」

在 CNCC 2018 大會現場,我們將榮幸在現場聆聽吳軍博士表達更多關於對大數據和科技的見解,雷鋒網 AI 科技評論將第一時間為大家帶來最新報道。

更多講者信息及議程,歡迎移步 CNCC 2018 大會官網瞭解,大會現已開放購票渠道,在 9 月 21 日之前完成報名即可享受優惠。

大會官網:http://cncc.ccf.org.cn/

雷鋒網(公眾號:雷鋒網)AI科技評論整理分享。


分享到:


相關文章: