普通二本畢業兩年,靠這個拿下60萬年薪入職阿里(文末有乾貨)

對於從事互聯網行業的人來說,很多人都夢寐以求能進入BAT中工作,然而進入BAT的難度有多大呢?想必去面試過的人都有自己的判斷。

BAT的入職門檻水漲船高,薪水情況又未必比其他公司多(見過不少從創業公司去了BAT的人,平薪,甚至降薪去)。原因嘛,大平臺有光環效應,巨大的業務規模,給未來提供的無形價值,相當於給自己職業生涯鍍金。

然而,對於一個非985、非211普通院校畢業兩年的本科生,想要拿到阿里60萬年薪算法的offer(工作地點在北京),難度自然是不小的。他是如何做到的呢?

普通二本畢業兩年,靠這個拿下60萬年薪入職阿里(文末有乾貨)


下面會逐條分析他簡歷,大家可以看看他有哪些亮點和不足?

1.畢業學校:某三線城市的XX工業大學。(非211、非985)

2.專業技能:

熟悉 javaPythonScala 語言。(都是主流編程語言,java自不必說。對於算法方向的,Python幾乎是必備,Scala是使用spark集群編程中的好武器。雖然也可以用java去使用scala。不過請注意,寫上了熟悉*語言,可得真熟悉哦。面試的時候,面試官問你Python中的裝飾器、或者讓你寫一段scala函數式編程的小任務,可不要傻眼哦。)

熟悉常見機器學習算法(分類、聚類、迴歸、協同等),熟悉深度學習基本理論及常用框架 Tensorfow/Keras

(算法工程師的理論基礎)

熟悉特徵選擇、特徵組合、特徵處理常用手段,落地工程化實現。(算法工程師平時工作中,對於特徵處理是有各種技巧的,面試官對於特徵處理,會有很多問法。)

有計算廣告/推薦系統/nlp 實踐經驗,通過機器學習算法優化召回、預估、排序等各環節模型。(對於一個廣告、推薦系統來說,召回、CTR預估、是核心環節)

熟悉 linux 平臺,有大數據處理平臺 HadoopSparkHiveStorm 等實踐經驗。(介紹了工具背景)

普通二本畢業兩年,靠這個拿下60萬年薪入職阿里(文末有乾貨)


小編點評:專業技能上,寫的還算可以,但也不是特亮眼,主要包含:

1、熟悉的編程語言;

2、瞭解的算法;

3、從事的業務領域,還有核心環節。

4、工作中的工具背景。

小編以為還可提高,如果加上自己的github 主頁地址,把自己曾經開發過的,可以公開的項目上傳,將會大大加分。或者寫上自己工作中,進行過優化過的算法,例如,如果能寫上,曾經優化過xgboost中,在線預測代碼的性能,那也是能大大加分的。說明候選人,在對算法的理解,和工程實現上,是和先進水平看齊的,具備和高手工程師合作的能力。當然,小編提醒,簡歷內容一定要是真實存在的哦。


3.職業經歷

某視頻流媒體公司:

項目名稱:信息流個性化推薦

項目背景:從0開始搭建視頻信息流

技術棧:模型相關:

1、召回層面:CF+Word2Vector +LDA+ SimRank

2、排序層面:LR(人工在線特徵+離線特徵工程)

工具相關: spark mllib + spark sql + spark streaming + Hive+ Java(Scala)+ redis + RabbitMQ

普通二本畢業兩年,靠這個拿下60萬年薪入職阿里(文末有乾貨)


召回策略:

1、根據用戶行為日誌,基於 ItemBased 協調過濾生成離線影片相似度矩陣和 用戶的離線推薦結果,優化隱形評分機制;按照時間進行降權,弱化熱點影片的權重。

2、熱門數據召回:用imbd算法,計算資源得分,根據不同時間週期得分融合並,線上 ab 對比, 選取最優的時間週期組合 ;按照 imdb 得分進行倒排,生成熱點召回數據和標籤召回數據。

3、word2vector 召回: 根據用戶行為,全部影片作為語料庫,每個用戶的行為作為一篇文檔,利用 w2v 算法原理計算所有影片的向量表達,根據向量距離準備召回數據;根據用戶的向量進行用戶聚類,利用聚類結果獲得相似用戶,形成召回數據。

4、Lda 召回:利用 lda 模型,選取不同 topic 進行試驗,將資源和用戶按照 topic 進行相似度計算,作為召 回來源。

5、SimRank 召回:將 user 與 item 的關係視作一個二部圖,基於 graph-based 算法相似關係可以在圖上傳播 的思想,使用 simrank 計算 Item 相似隊列。

排序策略:

1、特徵擴充:點擊率預估模型準備,嘗試多種新特徵或特徵組合進行模型的離線對比和線上對比, 將 W2v 和 Lda 以及影片封面的 AutoEncode 隱層向量用作排序特徵,迭代了多版邏輯迴歸模型

2、模型融合:利用 w2v 的結果進行用戶聚類並針對每類用戶進行模型的單獨訓練,並按照用戶到各聚類中心點的距離作為權重進行最終模型的組合,線上效果提升明顯

3、模型調研:wide and deep 模型線下實驗調研,強化學習在推薦領域應用調研,離線實驗,ffm 模型線 下調研實驗;

4、特徵工程:特徵工程時間窗口細化、統計特徵衰減、在線特徵交叉;

5、正負樣本採樣: 正負樣本的比例嚴重不均衡,基於曝光時間 showtime 和曝光順序進行 order,過濾負樣本。

小編點評:各位做算法的同學,這位同學的簡歷對於項目的介紹怎麼樣,每個要點短短一兩句話,就說的比較清楚了。

想知道阿里算法面試時經常會問到哪些問題和應對技巧麼?請關注我,轉發或留言,然後私信我“面試A”索取答案。

本人由頭條號“量雲大數據”原創,轉載請註明作者和出處。


分享到:


相關文章: