打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?

全文共4805字,預計學習時長

14分鐘

打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?

新年伊始是我們反思過去和計劃未來的時候。基於此,我想借此機會回顧身為深度學習/計算機視覺工程師的行業經歷。


2017年1月,我在舊金山的一家名為TrueAccord的公司工作。當時,我正使用時間序列和表格數據構建傳統的推薦系統。互聯網充斥著博客文章和論文,主要描述超越人類的新型前沿的深度學習模型。我迅速將熱情投入到這個令人無比興奮的新領域。


儘管具備一些關於深度學習的理論知識,但是我的實踐經驗非常有限。在研究生院我很少有機會運用機器學習模型,但幸運地是我發現了Kaggle,這讓我培養了深度學習的專業知識。最終,我獲得了 Kaggle Master 的頭銜,在超聲神經分割挑戰賽中奪得了金牌。這是將深度學習框架UNet廣泛用於Kaggle社區的第一次挑戰。同時也是將軟骰子用作分割任務的損失函數的第一次挑戰。


2017年以前,Kaggle主要舉辦表格數據競賽。勝出方案通常涉及到xgboost和其他經典ML算法的堆疊。很少有深度學習算法能夠取代這類技術。


在2017年,一切都發生了變化。深度學習越來越成熟並從學術界轉移到行業。Kaggle競賽跟隨時代發展趨勢,與影像相關的挑戰更加普遍。


我很喜歡TrueAccord的工作,但是我想從事與深度學習相關任務的職位。


問題是我具備的技能並不利於這種改變:


1. 我的專業是物理學而不是電腦科學。

2. 我只有一年的從業經驗

3. 我的簡歷中沒有任何與機器學習相關的論文。

4. 工作中沒有任何計算機視覺項目。

5. 深度學習知識有限。


基本上,我和其他任何試圖改變他/她工作方向的人都處於同樣的境地。


因此,必須和我身居同樣職位的人一樣處理我的情況。方法非常簡單:你去面試,如果可行,則完成。如果失敗了,就學習不知道的內容並重復。希望可以在有限的迭代中獲得成功,足夠幸運,獲得期望的職位。


在此期間,我繼續提高深度學習技能;閱讀論文,博客文章,當然還有參加深度學習比賽。


打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?


2017年3月,我和朋友Sergey Mushinsky在 Dstl衛星圖像特徵檢測挑戰賽493位選手中獲得第三名並拿到了2萬美元的獎金,我的工作開始得到回報。挑戰結束後,我開始熟悉二進制圖像分割和多光譜圖像,這通常存在於衛星圖像中。


我用獎金購買了第二個GPU,這反倒讓我意識到Keras和多種GPU設置不兼容。我切換到PyTorch,它仍然保留了深度學習框架。然而,成功並非一帆風順。在同一期間,我沒有通過 Descartes Labs的線上面試和一些技術屏幕問題。我知道我需要繼續努力提高技能。


那時,我受邀參加NVidia的線上面試,也失敗了。原因之一是我對2D對象檢測如何運作的瞭解不足。幸運的是,DSTL開始了安全通道:在航空影像挑戰中對車輛進行檢測和分類,其重點是2D檢測。他們決定不在Kaggle上進行,而是使用他們自己的平臺。


比賽中有一條重要的規則:“人人都可以參加,但每個人需要有護照並居住在能夠領取獎金的一些國家。”我住在舊金山,繳納美國稅。但是由於我是俄羅斯國籍,沒有資格獲得該獎項。我清楚這個不幸的事實,但是比賽還是提供了對象檢測器的寶貴實踐,在勤奮工作後,我能夠在比賽中獲得第二名。


由於廣泛的國際社會齊心合作,數據科學取得了很大的進步。我在Facebook和Twitter上發表了看法,認為DSTL的規則與這些理想相悖。但是隨著一切塵埃落定,我腦海中清除了這一點,繼續向前看。不知何故,這個故事一直伴隨著我並被俄羅斯新聞選中。不久,我的照片出現在俄羅斯主要新聞媒體和電視頻道的首頁上。


英國國防實驗室開發了用於MI-6、人工智能算法的工具。一名俄羅斯公民因為國籍而被拒絕獲得獎項。這是個好故事,俄羅斯媒體很快清楚了這一點。那時,我對攝像機採訪感到不自在,因此我拒絕與記者交談。這並沒有阻止他們。他們將我的個人資料圖片放到背景並且邀請該主題的專家發表意見,


記者甚至聯繫我父母,他們對機器學習、比賽以及所有的故事一無所知。我母親告訴記者,父母是非常重要的,但是低估學校教師的影響是不明智的。母親的話起了作用,記者們帶著疑問前往我的高中學校。


俄羅斯最大的科技公司之一Mail Ru Group決定利用這次機會來獲得有利的公共關係。他們建議給予我15,000美元,這相當於挑戰賽的二等獎。我喜歡這個主意,但是我覺得這不公平。我完全認同我沒有資格獲得獎項的規則。而且,我對在簡歷中補充我開發了用於英國MI-6的人工智能算法並不是特別激動。我想到了一個更好的解決方案。我熱愛理論物理學並且知道很難獲得充足的資金。因此,我要求將資金轉移到支持基礎科學的俄羅斯基金會。


最後,一切都進行順利。我和Mail Ru Group得到了有利的公關。俄羅斯基礎科學獲得一萬五千元。而且DSTL得到激發,對機器學習比賽的規則三思而行。


俄羅斯觀眾對該故事關注了幾天,之後得到平息。


打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?


轉眼間,三月變成了六月,而我仍然沒有找到計算機視覺工作。


我名單上的下家公司是特斯拉。由於我的Kaggle成果,招聘人員聯繫了我,這種情況少有發生。我通過了實地測試、技術檢查和線上面試。下一步是背景審核以及Elon Musk批准我的申請。而我沒有通過。招聘人員告訴我,我違反了保密協議(NDA)並在一個論壇上談及面試過程。沒錯,我確實在 ods.ai頻道提及我在特斯拉的面試,但是我沒有分享任何相關的面試問題。嚴格意義上來講,他們說的沒錯。我記得特斯拉的保密協議十分嚴格並且禁止談論面試過程。


這次失敗讓我十分沮喪。和Andrei Karpathy共事將會多麼激動人心啊。即使是現在,已經是幾年之後,我仍然為自己創造不正之風而感到愧疚。希望我將有機會為自己的行為致歉。


接下來是Planet:我從Kaggle的太空競賽中瞭解亞馬遜。這個問題太簡單了,不需要花費很多時間。小數據集上面有多標籤分類。所以,我和另外六個人組成一個團隊。一週內,我們訓練了480個分類網絡並將其堆疊。在938位中排名第七。


負責組織競賽的公司是 Planet Labs。他們有開放的深度學習工程師職位,我對其進行了諮詢並應邀參加線上面試。我又失敗了。得到的反饋是深度學習知識不夠深入。


八月中旬,經過7個月的求職後,我開始失去積極的態度和信心。我正好開始與Lyft的面試,但是我認為這次面試會和之前所有面試一樣,以失敗告終。


我坐在窗前,用一杯白蘭地來麻痺我的悲傷。我剛剛又遭到了拒絕:


我剛剛又遭到了拒絕:


一位谷歌員工推薦你擔任Google Brain(美國)研究科學家一職。我們仔細審查了你的背景和經歷,然後決定暫時不繼續進行你的申請。


它開始吸引我。


打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?


但是我有一個想法。每當身處惡劣的情況,總有一些辦法可能奏效。大部分拒絕是在簡歷篩選階段收到的。結果,我沒有機會展示技術技能。為了避免此類擔憂,我認為需要在簡歷中添加深度學習發表作品。


我聯繫了麻省理工學院的博士後 Alexey Shvets,並提出了一個建議:


1. 查找下一個具有競賽記錄的深度學習會議。

2. 訓練模型,創建提交,獲得最後的位置(我認為如果人們花幾年來解決某個問題,那麼對他們來說很難成為合法的競爭)

3. 在學術數據集上寫預印本或論文,描述我們的解決方案。


他同意了,我們尋找適合的會議,遇到了發生在三週內的MICCAI。它有一家名為 內窺鏡視覺挑戰賽的工廠,舉辦了一些計算機視覺競賽。截止日期為8天。


我們選擇了第一個挑戰,GIANA。該問題有三個分級挑戰。在接下來的8個晚上,我調整了在Kaggle競賽中使用的管道、重構代碼並訓練新模型。Alexey撰寫了描述這個方法的報告。我們堅信自己在排名榜末尾。因此,我並沒有對該問題投入太多時間。我們將提交的內容和報告發送給了組織者。我認為這將是小冒險的終結。事實並非如此,Alexey發現該研討會還舉辦了另一項名為機器人儀器分割的比賽,包括三個子挑戰,且截止日期延長至四天。他問我是否願意試試這些挑戰。我同意了,把自己關了四個晚上,然後為組織者製作代碼、模型並進行了預測。


該挑戰來自一個警告:團隊的一員需要前往MICCAI和展示結果。最終狀態僅在會議公佈。


我從未去過魁北克市和加拿大,因此我很高興並同意前往。


研討會的那天到來了。我參加該研討會,發現了由熱情四溢的醫學影像專家組成的龐大團體,他們彼此瞭解。我不認識任何人,也無法開啟談話,因為我總體上能適應深度學習和計算機視覺。儘管如此,醫學影響所有細節對我來說還是有些陌生。


第一個挑戰的呈述開始了。來自各個大學的團隊表達他們的解決方案。很難去評判方案的好壞程度,但是很明顯他們投入了很多準備工作。輪到我了。我走到講臺,告訴聽眾我不是該領域的專家,而且我們只是將這次挑戰作為深度學習的一次練習,為浪費他們的時間而感到抱歉,然後展示了兩張幻燈片。


組織者展示了結果。


1.第一部分挑戰—我們是第一名。

2.第二部分挑戰—我們是第三名。

3.第三部分挑戰—我們是第一名。


整體第一名(官方新聞稿)


打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?

到第二個挑戰了,其截止日期改為四天了。不同的團隊介紹了他們的解決方案。我再次為浪費聽眾的時間而道歉並展示了我們的兩張幻燈片。


第一,第二,第一。總體排名第一。


直至今日,我都記得那一刻。我正站在現場,組織者正在準備支票和禮物。我和Alexey勝利地走出來,但是我不禁對這明顯的荒謬感到沮喪。在醫學影像領域都沒有專業知識的某些傢伙在兩次挑戰中都名列第一,這是如何發生的呢?然而,以從事醫學影像工作為生的人會使用更弱的模型嗎?


我問聽眾:“你們知道我在哪裡工作嗎?”除了審查過我LinkedIn個人資料的一個組織者之外,沒人知道。我告訴他們我在收債公司TrueAccord工作,工作中並沒有訓練深度學習模型。我感嘆自己無法擺脫這種模式,因為Google Brain和DeepMind的人力資源甚至都沒看我的簡歷。


在激動人心的演講結束後,觀眾席中DeepMind衛生團隊的成員在休息期間問我是否有興趣面試他們團隊的研究工程師職位。


我認為這是有史以來第一次,收債公司贏得了醫學影像比賽。:)


不久之後,我收到了Lyft的錄取通知,這是我目前工作的地方。在TrueAccord和Lyft之間的間隔期間,我參加了Kaggle上的 Carvana 圖像掩模挑戰。GIANA的方法使我到了排行榜的後20%。也不斷提出了新的想法,Vladimir Iglovikov、Alexander Buslaev和Artem Sanakoyeu的團隊在735位中排名第一。


這場競賽是第一個重大挑戰,團體開始在UNet類型結構中使用預訓練編碼器。這是當前的規範並且存在許多出色的庫,可以通過各種不同的預訓練編碼器來獲得不同的分段網絡。但在當時,想法十分新穎。該挑戰促成了名為TernausNet的預印本,這是我和Alexey為了好玩,令人驚訝地是這竟是我引用最多的作品。


打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?


8個月內,我在感興趣的領域找到了一份滿意的工作。那段時間是艱苦的。嘗試新事物時會犯錯誤。每當失敗時,會感覺自己真愚蠢。經歷一次一次失敗後,可能開始對自己失去信心。但是記住你是在學習新事物。邁出的每一步會更接近預期目標。


在過去幾年裡,我在自己的谷歌學術資料中添加了深度學習論文:)

打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?

打怪升級,看俄羅斯小哥是如何從互聯網轉行到自動駕駛行業?

我們一起分享AI學習與發展的乾貨


分享到:


相關文章: