「機械戰警」牽起他與數據科學的緣分——數據科學50人·鄔學寧

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

文 | 程一祥

題圖 | 站酷海洛

鄔學寧,SAP硅谷創新中心首席數據科學家,長期致力於機器學習與人工智能算法研究與應用。“數據科學核心算法的基礎是簡潔優美的數學,這是我願意用一輩子,去追尋的事情。”

1987年,一個“機器人警察”的科幻英雄形象席捲了電影市場。荷蘭導演保羅·範霍文,用“半人半機器”的造型,塑造了一個意志堅強、除惡揚善的孤單英雄形象。

這部硬科幻《機械戰警》用好萊塢的方式,預言了那時人們眼中可能出現的“人工智能”形象——它不是“終結者”式的誕生了自我意識的機器,而是一個換上了機械身軀的人類自己。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

(圖片說明:1987年上映的經典科幻電影《機械戰警》海報;圖片來源:IMDb)

《機械戰警》是中國最早引進的“人工智能”類科幻電影之一,當時很多電影院還採用了香港版的中文翻譯片名《鐵甲威龍》,凸顯這個角色帶給人們的震撼。那時還在上中學的鄔學寧,深深迷戀上了這部電影,他反覆看了好多遍,一種對“人工智能”的朦朧意識,就這樣在一個他的心中埋下了伏筆。

▍“機械戰警”引發的決定

“看到那個電影之後,就覺得,我以後一定要做機器人了!”

鄔學寧認為,當年那個叱吒風雲的機械警察,是他對人工智能最原始的啟蒙。

中學時期的鄔學寧成績很好,是一個喜歡研究物理,沒事兒愛下圍棋的少年。對於即將到來的高考,以及自己要選擇的未來,鄔學寧沒有想過太多。

“我的人生就在高三看到那部電影的時候,改變了。”鄔學寧說,一部電影,讓他瘋狂迷戀上了“機器人”這個酷酷的話題。“於是我就拼命找,看中國哪個大學的本科有機器人專業。找到以後,本科兩個批次的第一志願全都報的這一個專業,當時就是有這樣的熱情。”

鄔學寧選擇的是家鄉上海工業大學的機器人專業,這是錢偉長校長推動設立的國內當時唯一一個“機器人工程”本科專業。“高考分數我比第一批(重點大學)的分數線高42分,清北復交都幾乎任何專業都可以選擇,但是對我都沒有吸引力,我只要學機器人。”16歲的鄔學寧當時帶著一種對機器人的偏執,走進了大學校園,開始了他夢寐以求的“機器人”生活。

《機械戰警》這部電影對鄔學寧的影響,一定程度上反映了那時人類對人工智能話題的狂熱追捧。二十世紀八十年代,除了《機械戰警》外,好萊塢的大熒幕上頻繁地出現以“人工智能”角色為主題的科幻電影作品,包括《終結者》《霹靂五號》《銀翼殺手》等。

大量的科幻電影開始在人工智能的基礎上,探討人類與機器、生命等的哲學關係,《銀翼殺手》更被視為賽博朋克電影題材的開山鼻祖,彷彿在暗示著這種末日似的人機關係,即將在不遠的未來變為現實。

這些藝術作品的井噴式出現,多少與八十年代的第二波人工智能發展浪潮有關。

1980年,人工智能領域“符號主義”學派率先取得進展。卡內基梅隆大學為數字設備公司 Digital EquipmentCorporation 設計了一款名為XCON的專家系統,這個系統能夠依據一組從專門知識中推演出的邏輯規則,在某一特定領域回答或解決問題,“智能”地給出解答。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

(圖片說明:早期人工智能專家系統 Symbolic 3620;圖片來源:Computing History)

XCON這種以解決某一特定領域知識的人工智能迅速成為商業的寵兒。在1986年以前,它每年能為公司節省下四千萬美元的成本。

幾乎與此同時,另一大主流學派聯結主義也不甘落後。物理學家 John Hopfield 證明了新的神經網絡模型,David Rumelhart 則對反向傳播算法進行了整理和推廣。從仿生學角度出發的聯結主義學派也重獲新生,將人工智能的研究推到了新高度。

人工智能的兩大主流學派在八十年代都展現出了突破性的進展,以及商業化落地潛力。日本、英國、美國等政府也開始加入到這場AI競賽中,紛紛大手筆撥款。這其中,以日本政府投資8.5億美元的“第五代計算機項目”最為矚目,他們當時的目標是,製造出一臺“能夠與人對話,翻譯語言,解釋圖像,並且像人一樣推理的機器”。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

(圖片說明:以東京大學計算機中心主任的元岡達 TohruMoto-Oka 為代表的日本科學家提出的第五代計算機的邏輯概念圖;圖片來源:Analysis, Design and Evaluation of Man–Machine Systems 1988 報告截圖)

然而,春天來得快,去得也快。

八十年代的AI熱潮,止於末期的硬件難題。專家系統的商業化奇蹟不再,神經網絡又因為數據量和計算能力不足而陷入停頓,一時間,學界和業界又進入到一片哀鴻遍野的狀態,政府領導的人工智能項目也無一例外,“第五代計算機”項目最後也無疾而終。

對人工智能的失落,也同樣出現在了鄔學寧身上。來到大學後,他發現自己所憧憬的機器人,不過是在工業流水線上工作的一些“機械臂”,與“酷”完全搭不上關係,更別說擁有智能了。“我覺得這個落差太大了,跟電影完全不一樣。”即使過了這麼多年,鄔學寧談起剛上大學時的經歷,仍難掩失望之情。

但是來都來了,機器人硬件不好玩兒,那不如試試軟件。他把空餘時間都花在了計算機上,歪打正著地開始了自己的數據科學生涯。

▍十年曲折

與其說是人工智能,鄔學寧認為,機器人工程專業更多的是偏向一些自動化的東西,應用領域也主要集中在工廠車間,既沒有了電影中那種酷酷的外形,也沒有像人一樣思考的內在智能。

“我們畢業之後,也沒有辦法找到人工智能的工作,大部分同學都轉行了。只有一位‘專業對口’的同學去了一個摩托車公司的自動化機器人生產線。”

放棄了機器人的幻想後,鄔學寧把眼光放到了計算機軟件上。他們專業當時有一個計算機視覺實驗室,九十年代初,這裡主要在嘗試利用神經網絡處理計算機視覺問題,這是當時與人工智能最接近的前沿領域,他曾整日泡在那裡。不過受限於第二次AI寒冬的影響,這件事兒後來也不了了之。

畢業後的十年,用他自己的話說,是迷茫的十年。“我彷彿一直在尋找一個什麼東西,尋找一個人生方向。”機器人的夢想清醒後,鄔學寧卻一直沒有找到另一份讓他像當年那麼心動的事業。

鄔學寧曾經嘗試過創業。本科畢業後,他憑藉計算機技術,與老師合夥創辦了一個財務軟件公司;後來,又跑到澳洲讀書學習管理;2000年初加入SAP,又從技術從頭做起;他在SAP考了12個領域專業證書,嘗試過開發、集成、供應鏈等SAP多個業務線的工作......

“現在回過頭來看,好像那十年我繞了很大的彎路,與數據科學漸行漸遠。但是我自己知道,有句廣告詞說的好,人生沒有白走的路,每一步都算數。”鄔學寧覺得,十年間雖然沒有太明確的方向,但是他的每一步試錯,都將在未來為他帶來回報。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

(圖片說明:人工智能的歷史發展曲線,這次的繁榮後會是下一個AI寒冬麼?)

鄔學寧的職業曲線,在這十年間與人工智能歷史軌跡有著某種相似。八十年代的AI浪潮破滅後,資本界在之後的十幾年間基本沒有為人工智能再注入大規模的資金資源,行業的發展一度停滯。雖然以神經網絡為代表的聯結主義在學界不斷取得突破,但是在硬件算力和數據的限制下,人工智能始終無法在業界得到更大的支持。

2008年的時候,一次偶然的項目經歷,讓鄔學寧感覺在探索的迷霧中,彷彿看到了一絲亮光。這是一個幫助澳大利亞某酒類品牌進行市場定價的項目。傳統的定價策略大都是參考同類競品等,依賴運營者的經驗。但這一次,鄔學寧的團隊則基於AC 尼爾森收集的過去三年間,所有市面上的飲料產品的運營大數據,通過模型和算法解決了這一問題,這個案例對他影響非常大。

“第一次看到大數據處理問題的方式,那個數據量非常大,當時的電腦算力訓練模型要跑一天一夜才有結果。但是這麼複雜的運算,背後是簡單完美的數學模型,效果又很神奇。後來知道,哦,這是數據科學範疇的事兒。”鄔學寧說到。

這個案例之後,他確信自己花了十年尋覓的方向終於出現了——數據科學。鄔學寧現在回憶時說到,當他2008年選擇數據科學這條路的時候,生命中之前那些一個個散落的珠子,彷彿終於串成了一條線——數據、編程、業務、管理等等,每一次看似彎路的選擇,都在數據科學的框架下逐漸找到了自己的位置。

▍發現數據科學

“其實08年的時候,國內還沒有人說‘數據科學’或者‘大數據’,也沒有‘人工智能’的熱潮,我雖然確定地選擇了這個方向,但是其實並不知道它叫什麼,後來舍恩伯格出了一本書,我一看,哦,原來我一直在做的這個事情,叫大數據。”鄔學寧說,自己和數據科學的緣分,就這麼結下了。

讓鄔學寧直接體會到數據科學價值的,是一次次基於實際業務的商業創新。

“一次國內某家主要賣生鮮的大型連鎖超市來找我們,想通過重新擺放貨架,提升銷售額。這件事兒要怎麼做呢?”鄔學寧給DT君舉了一個簡單的商業應用案例。“其實這是一個標準的關聯銷售的問題”,鄔學寧說,他們要做的,就是找出哪些商品擺在一起會有增益效果。

“比如說買車釐子的用戶,我們發現他還喜歡買山東桃。於是就把這兩個商品放在一起,帶動銷售。又或者可口可樂比百事可樂的消費帶動力多1塊錢,那商店就會多進一些可口可樂相關商品等。”這些結論通過傳統的方式是很難獲得的,只有通過定量的大數據分析,我們才能知道。這是數據科學的魅力。

當鄔學寧去細分行業內做數據科學的業務時,他常常會遇到一些“uh-ha moment”。“我們的數據分析往往都是純從數據科學的算法模型角度來做的,但是結果一出來,很多行業專家看到,會有一種‘啊哈’的感嘆,就像‘原來是這樣,我怎麼沒想到呢?’一樣,就非常有趣。”

2016年,AlphaGo與

李世乭的世紀大戰正式拉開了人工智能第三春的序幕。作為資深圍棋愛好者,這一歷史性事件,對鄔學寧的影響也是巨大的。神經網絡、機器學習,鄔學寧發現這些自己曾經遇到過的研究方向,一時間成為了全世界最熱門的話題。“人工智能”這個詞彙時隔二十年,再次回到了自己的視線中。

與市場的狂熱不同,再次進入人工智能行業的鄔學寧,如今對這個概念有了更多自己的思考。

“人工智能就像一座漂浮的冰山,人們能看到的機器學習等技術是冰山露出的一小部分,可能只佔10%,還有90%都潛藏在海平面以下的其實是數學,包括概率、統計、線性代數和圖論等等。”他認為,數學和統計學才是人工智能領域的核心競爭力。

對於鄔學寧自己來說,數據科學中最吸引他的地方,在於在紛繁複雜的問題背後,指導大數據得出結論的數學方法。“就是你第一眼看到那麼多數據,用GPU跑幾天幾夜進行訓練,要解決的實際問題有那麼多種可能性,但這個龐大系統的背後,是一種以數學表述的算法,很酷,很強大。”

鄔學寧又想起曾經讓自己迷戀的機器人,也是那麼酷,看起來那麼強大,不同的是,這一次,他的興奮不再只是空想。

▍AI很強大,但並非無所不能

鄔學寧現在在SAP擔任創新中心的首席數據科學家,經常對接不同領域的客戶,利用人工智能算法進行業務創新。他曾負責過的多個不同行業的AI項目,例如:中醫舌診預測糖尿病風險、北美大型超市銷量預測、巴西銀行業務量分析、西班牙智慧城市、迪拜購物中心能源管理,鋼鐵製品的質量預測等等。

除此之外,鄔學寧還非常關注數據科學在體育行業的應用。2018年世界盃正在如火如荼地進行,本屆比賽中,VAR(視頻助理裁判)的表現大放異彩。這是國際足聯首次將 VAR 技術應用到世界盃的舞臺上,它的出現大大提升了足球比賽中裁判的準確性。

VAR技術的核心在於環繞球場佈置的33臺攝像機,這些攝像機不僅能夠記錄比賽中每個精彩的瞬間,讓裁判的判罰更加公平,而且還充當了數據採集器的角色,能夠實時捕捉運動員的跑動、傳導、射門等精確數據,讓整場足球比賽數字化。之後,球員、教練員等就可以使用這些體育大數據,從而指導自己的比賽和訓練。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

(圖片說明:SAP 針對足球隊設計的數據科學管理分析系統Sports One;圖片來源:SAP官網)

SAP是體育大數據領域的先行者。從2013年開始,SAP與德國足協DFB合作,推出 Sport One 商業數據分析系統,將數據分析技術應用到足球的日常訓練中。除了攝像機外,包括附帶芯片的足球、帶有傳感器的運動服裝等等,球場上的所有動作已經能夠被數據越來越精確地描繪出來。從初級的位置分析、到細節的點球策略,再到運動員的心理狀態,大數據開始越來越多地介入到足球訓練中。而且它也確實幫助球隊提升了比賽表現。

比如,它曾經幫助德國隊贏下了上一屆巴西世界盃的冠軍。不過,數據科學也仍存在很多侷限,算法並不能完美描繪出真實的體育環境。在本屆世界盃上,衛冕冠軍德國隊由於表現欠佳,遭遇小組出局。

體育比賽中,運動的心理因素、戰術執行、還有各種偶然因素(受傷、犯規等等),都是目前體育大數據還無法預測和解決的事情。

對於經歷過人工智能的寒冬,也曾在數據科學中迷茫尋找方向的鄔學寧來說,他對目前人工智能發展的侷限性也有著深刻的認識。”經歷了符號主義和聯結主義後,以AlphaGo為代表的行為主義人工智能學派開始展現出巨大潛力。深度學習的紅利正在逐漸耗盡,未來人工智能的發展方向應該是多學科的融合,心理學、腦科學、博弈論甚至量子力學都將對人工智能產生舉足輕重的影響,人工智能的各個門派也將摒棄前嫌,一起攜手為人類創造更好的為未來。”鄔學寧說到。

在鄔學寧看來,不論是數據科學還是人工智能,他現在所做的事情都是以數學為基礎的工作,“數學是上帝的語言”,鄔學寧認為,這是一個接近“真理”的方向,是他願意執著追求的事業。機械戰警的憧憬停留在了昨天,現在他想要追求的,是已經觸手可及的未來。

▍數據俠門派

鄔學寧,SAP硅谷創新中心首席數據科學家,復旦大學人工智能客座講師,致力於機器學習與人工智能算法研究,在全球零售、金融、製造、醫療、智慧城市等不同行業擁有豐富的利用大數據進行產品與商業模式創新的經驗,著有《SAP企業機器學習》(清華大學出版社),曾擔任教育部高教委骨幹師資培訓班大數據課程講師,openSAP講師。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧

▍數據科學50人

“數據科學50人”項目是DT財經旗下數據俠計劃重點內容產品,與數據科學領域KOL挖掘數據內容的價值。我們從商業數據科學領域選出最具代表性的50位先鋒進行深度專訪,50人由DT財經獨立評審併發布,第一財經數據科技及合作伙伴傾力支持。

“機械戰警”牽起他與數據科學的緣分——數據科學50人·鄔學寧


分享到:


相關文章: