對於從事互聯網行業的人來說,很多人都夢寐以求能進入BAT中工作,然而進入BAT的難度有多大呢?想必去面試過的人都有自己的判斷。
BAT的入職門檻水漲船高,薪水情況又未必比其他公司多(見過不少從創業公司去了BAT的人,平薪,甚至降薪去)。原因嘛,大平臺有光環效應,巨大的業務規模,給未來提供的無形價值,相當於給自己職業生涯鍍金。
然而,對於一個非985、非211普通院校畢業兩年的本科生,想要拿到阿里60萬年薪算法的offer(工作地點在北京),難度自然是不小的。他是如何做到的呢?
下面會逐條分析他簡歷,大家可以看看他有哪些亮點和不足?
1.畢業學校:某三線城市的XX工業大學。(非211、非985)
2.專業技能:
熟悉 java、Python、Scala 語言。(都是主流編程語言,java自不必說。對於算法方向的,Python幾乎是必備,Scala是使用spark集群編程中的好武器。雖然也可以用java去使用scala。不過請注意,寫上了熟悉*語言,可得真熟悉哦。面試的時候,面試官問你Python中的裝飾器、或者讓你寫一段scala函數式編程的小任務,可不要傻眼哦。)
熟悉常見機器學習算法(分類、聚類、迴歸、協同等),熟悉深度學習基本理論及常用框架 Tensorfow/Keras。 (算法工程師的理論基礎)
熟悉特徵選擇、特徵組合、特徵處理常用手段,落地工程化實現。(算法工程師平時工作中,對於特徵處理是有各種技巧的,面試官對於特徵處理,會有很多問法。)
有計算廣告/推薦系統/nlp 實踐經驗,通過機器學習算法優化召回、預估、排序等各環節模型。(對於一個廣告、推薦系統來說,召回、CTR預估、是核心環節)
熟悉 linux 平臺,有大數據處理平臺 Hadoop、Spark、Hive、Storm 等實踐經驗。(介紹了工具背景)
小編點評:專業技能上,寫的還算可以,但也不是特亮眼,主要包含:
1、熟悉的編程語言;
2、瞭解的算法;
3、從事的業務領域,還有核心環節。
4、工作中的工具背景。
小編以為還可提高,如果加上自己的github 主頁地址,把自己曾經開發過的,可以公開的項目上傳,將會大大加分。或者寫上自己工作中,進行過優化過的算法,例如,如果能寫上,曾經優化過xgboost中,在線預測代碼的性能,那也是能大大加分的。說明候選人,在對算法的理解,和工程實現上,是和先進水平看齊的,具備和高手工程師合作的能力。當然,小編提醒,簡歷內容一定要是真實存在的哦。
3.職業經歷:
某視頻流媒體公司:
項目名稱:信息流個性化推薦
項目背景:從0開始搭建視頻信息流
技術棧:模型相關:
1、召回層面:CF+Word2Vector +LDA+ SimRank
2、排序層面:LR(人工在線特徵+離線特徵工程)
工具相關: spark mllib + spark sql + spark streaming + Hive+ Java(Scala)+ redis + RabbitMQ
召回策略:
1、根據用戶行為日誌,基於 ItemBased 協調過濾生成離線影片相似度矩陣和 用戶的離線推薦結果,優化隱形評分機制;按照時間進行降權,弱化熱點影片的權重。
2、熱門數據召回:用imbd算法,計算資源得分,根據不同時間週期得分融合並,線上 ab 對比, 選取最優的時間週期組合 ;按照 imdb 得分進行倒排,生成熱點召回數據和標籤召回數據。
3、word2vector 召回: 根據用戶行為,全部影片作為語料庫,每個用戶的行為作為一篇文檔,利用 w2v 算法原理計算所有影片的向量表達,根據向量距離準備召回數據;根據用戶的向量進行用戶聚類,利用聚類結果獲得相似用戶,形成召回數據。
4、Lda 召回:利用 lda 模型,選取不同 topic 進行試驗,將資源和用戶按照 topic 進行相似度計算,作為召 回來源。
5、SimRank 召回:將 user 與 item 的關係視作一個二部圖,基於 graph-based 算法相似關係可以在圖上傳播 的思想,使用 simrank 計算 Item 相似隊列。
排序策略:
1、特徵擴充:點擊率預估模型準備,嘗試多種新特徵或特徵組合進行模型的離線對比和線上對比, 將 W2v 和 Lda 以及影片封面的 AutoEncode 隱層向量用作排序特徵,迭代了多版邏輯迴歸模型
2、模型融合:利用 w2v 的結果進行用戶聚類並針對每類用戶進行模型的單獨訓練,並按照用戶到各聚類中心點的距離作為權重進行最終模型的組合,線上效果提升明顯
3、模型調研:wide and deep 模型線下實驗調研,強化學習在推薦領域應用調研,離線實驗,ffm 模型線 下調研實驗;
4、特徵工程:特徵工程時間窗口細化、統計特徵衰減、在線特徵交叉;
5、正負樣本採樣: 正負樣本的比例嚴重不均衡,基於曝光時間 showtime 和曝光順序進行 order,過濾負樣本。
小編點評:各位做算法的同學,這位同學的簡歷對於項目的介紹怎麼樣,每個要點短短一兩句話,就說的比較清楚了。
想知道阿里算法面試時經常會問到哪些問題和應對技巧麼?請關注我,轉發或留言,然後私信我“面試A”索取答案。
本人由頭條號“量雲大數據”原創,轉載請註明作者和出處。