一名阿里安全一線AI算法工程師的“三觀”

在阿里巴巴集團安全部,有一個專注於計算機視覺、自然語言處理、機器學習和深度學習的團隊,其全稱為阿里安全圖靈實驗室。該實驗室的相關技術廣泛應用於手淘、天貓、支付寶、閒魚、優酷土豆、UC、阿里媽媽等核心業務線,每天服務調用次數達數十億,在為數億用戶創造極致體驗的同時;實驗室還通過阿里雲上的“實人認證”和“內容安全”兩大產品,對外輸出AI能力。

據瞭解,阿里安全圖靈實驗室成員多數來自於清華、北大、中科院、浙大等頂級高校的博士、碩士,具有深厚的學術研究背景和良好的工程實踐能力,先後申請了50多項專利。

今天我們要說的主角就是一名在阿里安全圖靈實驗室成長起來的AI算法工程師——炫謙。

1)機器人與專利

2007年,炫謙考入中國科學技術大學(中科大),然後主要做信息信號處理(DSP,Digital Signal Processing)相關的事情。大三的時候,炫謙做了兩件事。第一件事,參加中科大的機器人格鬥大賽;第二件事,參加學校舉辦的數學建模大賽;然後他都拿到了獎。

一名阿里安全一線AI算法工程師的“三觀”

讀研時期的炫謙

聽到機器人格鬥大賽,我腦子裡迅速浮現出谷歌的那個機器人,用腳踹都不會倒。炫謙設計的機器人可以行走、奔跑、側移甚至是翻越障礙物,然而這並不是全部。最終的是,炫謙的機器人要和其他同學的機器人打擂臺“正面剛”。因此,行走、奔跑之類的對於炫謙的機器人來說,只能算是小兒科,他需要自己設計的機器人更高階一些,那就是具有一定的攻擊性,而且要在功能上有所突破,比如抱摔,這對機器人的平衡性有很高的要求。

炫謙設計了專門的電路板來控制機器人的多個舵機,再通過舵機去操控機器人的各個關節。“我通過電流控制機器人的關節的角度,可以達到0-120度的幅度。”炫謙說。最後,炫謙設計的機器人喜提前三佳績(因時間久遠,炫謙已記不清是第二還是第三名了)。

本科畢業的時候,炫謙還做了圖像去霧的一些工作,當時的畢業論文也是以此為主。為此,他還獲得了一篇專利。

本科畢業之後,炫謙獲得了保送資格,被保送到了中國科學院大學在成都的光電技術研究所。

在阿里安全圖靈實驗室,炫謙的專利數也排名前列。

2)加入阿里巴巴

因為學業出色,炫謙被一位師兄推薦到阿里巴巴。阿里安全圖靈實驗室的負責人奧創看到炫謙的簡歷後,就給他打電話,並約了面試。因為是實習面試,所以很順利地就通過了。但由於導師要求他返校做項目,炫謙當時並沒有到阿里巴巴來實習。

後來校招的時候,炫謙又參加了一次面試,校招走的是綠色通道,就直接過了。當時校招的時候是阿里巴巴的技術大牛守拙和魯肅面試的,由技術高P甚至是CTO級別的面試,這是阿里技術人才招聘時一個常見的流程。

“阿里是第一個給我發Offer的,雖然當時阿里在人工智能方面還沒有太多佈局,但我覺得其潛力空間巨大,而且應用場景非常豐富,和業務也是緊密貼合的。”炫謙說出了原因。

實際上,炫謙返校去做的那個項目,讓他漲了不少經驗值。“當時我作為項目負責人,從申請經費到技術研發、合作等都是親力親為,正因為遍歷了項目的所有環節,所以讓自己有了全局意識,而不是僅僅侷限於某一項技術或其他細節。”

“如果是做一個業務項目,最好先把整體的框架弄出來,然後逐步地對每個點進行挖掘,其實就是全盤的考慮加上細節的思考。做項目一定要有全局視角。”炫謙認為,這個項目經驗對他之後在阿里的工作有很大的幫助。

一名阿里安全一線AI算法工程師的“三觀”

阿里安全圖靈實驗室AI算法工程師炫謙

事實上,炫謙在阿里巴巴的這幾年,也獲得了不少的榮譽。他公開發表多篇技術文稿,如《Securing Live Streams in China》、《九年雙十一互聯網技術超級工程》等。在去年,他還和幾個技術小夥伴一起獲得了2017阿里巴巴IoT極客大賽的冠軍;在今年3月,他代表阿里安全圖靈實驗室在Pascal VOC挑戰賽(Pattern Analysis, Statical Modeling and Computational Learning)的目標檢測(Object Detection)之Competition 3 :TRAIN ON PASCAL VOC DATA項目中獲得了74.8分,刷新了該項檢測的世界最好成績。要知道,Pascal VOC挑戰賽類似於數學中的哥德巴赫猜想,與ImageNet和COCO(Common Objects in Context)同為世界頂級的比賽。

3)“只想不做等於零”

炫謙剛進公司的時候,基本是出於一種接活兒的狀態,主管安排什麼就做什麼。而現在,炫謙已經切換到自由自主的狀態,也就是說可以自己去想一個方向,然後沿著這個方向去達成自己的目標。“有意思的事情一定要堅持去做,也就是堅持做正確的事情。”炫謙說。

因為阿里偏向於業務,所以很多時候會把自己放在比較繁雜的環境去做事,然而這樣對於技術的積累其實是很不利的。很可能把精力耗費在業務上,然後造成技術上沒有提升。對此,炫謙的解決之道是,把KPI和自己的成長打包整合在一起,兩條腿走路。“人工智能領域,核心的競爭力是技術。作為一個技術人,初心在於在技術領域扎得更深或做到拔尖。但是在阿里巴巴,更大的挑戰是需要把初心和現實進行合理的結合或者平衡,把兩塊合到一起去做。”

炫謙坦言,在學校的時候,學術性更強。可能去參加一些競賽或者比賽,幾乎都是一次性的。但是在公司做業務的事情,是需要長期性地不斷地去更新迭代,一批一批持續去做,不斷地跟進。

做學術的時候,會偏向於一些數據指標,比如把算法模型的準確率做得很高,因此,可能就不太關注它在機器上的運行效率,或者是它能否落地。“這其實就是一個產出投入比的問題。在企業不一樣的是,其實很多時候是需要注意機器的成本,或者說資源的消耗。”炫謙說。

在阿里,安全主要是保障工作,但投入產出比是需要衡量的,所以經常說安全是必須要做的,但安全的成本也是一個很大的挑戰,阿里安全的技術同學都要求綜合兼顧效果與成本。

這對於炫謙來說,其實也算是一個巨大的角色轉變,之前在中科大研究所更關注指標,而現在在阿里巴巴,還要充分考慮指標和資源之間的平衡。

實際上,炫謙還參與了很多貌似跟自己工作無關的項目。比如智慧餐線。炫謙認為,像類似這些項目可以視作是“趟路”。可能給同事提供失誤的經驗,讓其他技術同學知道這裡有個坑,已經被探出來了,其他的同學少走一些彎路。

一名阿里安全一線AI算法工程師的“三觀”

炫謙(左二)和小夥伴的“智慧餐線”項目奪得2017阿里IoT極客大賽冠軍

“試錯,試一下。大膽地去落地,去做。只想不做等於零。”炫謙強調。

炫謙說,項目的規劃很重要,但有時候雞蛋孵出了鴨子的事也經常發生。也就是說在做規劃的時候,有些事情並沒有想得那麼透,可能是根據用戶需求,根據業務的迭代出來的結果。這其實是在試錯,在未知的方向進行探索。

在阿里巴巴,有足夠豐富的場景去進行探索。炫謙說,他現在做的算法模型都會放到相對真實的環境去落地,比如放到線上,然後可能就會反映出一些問題,然後再不斷地進行有針對性的迭代、調優。

4)攻防中的AI

在阿里巴巴的體系中,其實並不是只有阿里安全圖靈實驗室專注算法、人工智能等領域,但它是獨特存在的,因為其聚焦於安全領域,是建立在攻防基礎之上的人工智能。

炫謙剛來阿里的前兩年主要是做OCR識別,但這跟攻防有什麼關係呢?炫謙舉了個栗子。現在互聯網上很多的圖片,於是黑灰產人員為了引流,就在這些圖片上去濫發一些垃圾廣告,這是一個非常大的問題。此時,就需要通過技術去識別這些圖片,然後將其屏蔽掉,然而,這些黑灰產會想盡辦法去繞開這些屏蔽手段,他們會不斷變異這些圖片。

相對來說,黑灰產是一個主動變化的過程,他們的成本低得多,而且變化非常快,因為他這個是和利益強綁定的。他們是隻要覺得這條路走不通,馬上就會變招,有時候剛上線一個新的技術去遏制,但很快,或者一個星期或者兩個星期,他們就能繞開。而且,黑灰產一旦發現從某一個角度能夠發出這些廣告圖,他們馬上就能夠迅速地、批量地生產這種圖,並在網上很快地擴散。

“黑灰產還會對算法模型就行不斷的試探,一旦他們探測出防禦的策略或技術手段,馬上就會去做針對性的改變或開發。“炫謙說。

炫謙介紹說,黑灰產還會形成一些暗號式的黑話,很難去篩查出來,而且看到的都是很正常的,但仔細排查後,會發現,他們的交易記錄以及買家的情況,是侷限在一個非常小的範圍。深入去挖掘,會發現這些黑灰產團伙的性質,他們在不斷地升級自己的“反偵察”手段。

這個過程其實就是充滿對抗性的。

5)享受良性的競爭

炫謙在阿里的頭兩年,面臨很大的壓力,內部的壓力,業務的壓力等,所以當時也比較困惑。

但從前年開始,炫謙開始轉變思路,用一些更偏向於基礎的檢測技術,去把業務重新做起來。比如為大文娛做的臺標檢測,還比如給淘寶做的商標識別等。這些都很容易中途發生變化,對技術的要求較高,也相當於是重新切換領域和方式,可以說是從頭開始。

“現在整體的工程類的技術更新迭代非常快,無論是從那個點切入,去從最新的技術開始研究,就是說,你一定要有好奇心,然後還要具備一定的工程能力,就可以切入一個不錯的,還能提升自我能力的層面,而且在大公司學習的資源非常多。”炫謙說。

其實,炫謙當時做的OCR技術或產品在阿里內部也是處於領先地位的。但其實類似的產品或技術也有一些,就形成了一定的競爭。不過,炫謙認為良性的競爭,最終的結果就是產出很不錯的產品或技術。確實,在阿里內部的很多技術或產品的競爭都是良性的產出。

對於競爭,炫謙覺得需要從另外的視角去看,需要研發人員找出自身業務的差異性,或者是自己獨特的點是什麼,也就是自己的核心競爭力在哪裡。無論是從業務層面的思考,還是從行業領域層面的思考,自己要有獨特的東西。

體系內的良性競爭,其實更有利於營造好的技術氛圍,並促進技術的提升。

從常理來看,在企業,大家幾乎都會認為自己做的事情是最重要的,也是最有價值最有意義的。因此,在評估的時候,可能就會面臨“同行”的挑戰。但這並不是存心的,而是說他們也可能面臨著一些挑戰,比如來自業務的壓力。所以技術研發要做到業務前面去,幫他們分擔這些壓力,也就是常說的“換位思考”。

技術研發人員要深入瞭解業務內容,比如說一線的銷售或客服同學,他們直接面臨客戶,也直接面對著巨大的壓力,如果後臺產品或技術沒做好,客戶的抱怨或者投訴,他們是第一時間要承受的。炫謙認為,技術開發人員要設身處地地去思考這些問題,最終把結果拿出來,幫助業務解決問題,才能為用戶提供更好的體驗。

“自己要靜下心來去探尋問題的原因,然後結合業務方所處的位置,一定要形成良性的循環。”炫謙說。

由於互聯網的快速性,所以在阿里巴巴,其實業務的變化也是非常快,也非常頻繁的。技術開發人員很有可能在覺得自己對這個項目或業務很有信心,躊躇滿志的時候,突然發生變化。這時候,應該趕緊從坑裡“爬出來”並重新快速地投入到新的業務或項目之中。此時要及時調整心態,這個其實是極為挑戰的。

面對這種挑戰,炫謙表示自己的心態現在很平和了,已經能夠在很短的時間去重新投入另外的戰場。

6)興趣是最好的老師

人工智能現在是一個特別火的領域,所以很多相關專業的應屆畢業生會志得意滿。炫謙說,希望這些新同學能靜下心來,一點點地去積累,包括在數據方面,在模型訓練,甚至是現成的服務的維護方面打好基礎。

一方面要在技術上下功夫,緊跟最新的技術前沿;另一方面,還需要在業務中不斷地具備落地的能力。就是說,把自己研究的技術成果,落地到一個具體的項目裡,讓它產生價值。

因為人工智能市場的極度火爆,會推高行業的薪資水位等,但這並不是說你因為學習了人工智能,就表明你的能力一定強,而實際上是因為行業的趨勢抬高了。應屆生應該要有這種清楚的自我認知,不然很可能會迷失。

“儘量少吹牛,把承諾的事情做好,不要被打上不靠譜的標籤。”炫謙的建議是,紮紮實實地一步一個腳印地去做,同時,開闊自己的眼界,多去了解和學習技術,不一定要侷限於一個點,因為技術是多種多樣的。從這些技術領域中,發現自己感興趣的,培養自己的興趣點和好奇心,因為興趣才是能夠長期激發自我的東西。

“應該用興趣做自己的老師,那麼才能持久地投入極大的熱情。”炫謙說。


分享到:


相關文章: