京東JData算法大賽水平怎麼樣?

手機用戶82546872299

今年大賽比較多,可以說各種比賽扎堆了,kaggle,天池,JDATA,騰訊,DF, DC,kesci等,各個平臺都有大賽在舉辦,比賽也多種多樣。如何選擇一個合適比賽就比較關鍵了。如果你是應屆生,想直接拿下某個offer的話,可以參加JDATA,這是最保險的,其他大賽,不保證直接給。福利在下面,自己看,還有一個,對於非應屆而言,JD RUN是一個很好的項目。如果只是想練手,找一個喜歡的方向,或者自己在行的方向,選一個比賽參加。

1.介紹大賽基本情況

本次比賽是京東集團舉辦的,上面是福利。高額的獎金,還有sp offer以及JD RUN機會。對於應屆在校生,最好的福利就是offer,京東的sp,去年價位28.6,今年可能會上漲一定幅度。而非應屆生,JD RUN是最好的項目,可以結交到很棒的小夥伴(大多數海外背景),以及豐富你的簡歷。

很多小夥伴可能會疑問,每隻隊伍是否只有一個offer,以及去什麼部門。去年JDATA大賽情況來看,拿獎的一大部分去了JDATA各個部門,還有去其他互聯網公司的,比如阿里,騰訊,美團等等。所以每隻隊伍不單單隻有一個offer,可能有的隊伍五個人內拿到4個offer,去年這種情況比較多見,而且可以和boss以及hr商量,是雙向的。拿了offer,去不去京東或者希望去哪個部門,那就是你自己的選擇了。

* Special offer:

(1)社會優秀人才及應屆生:通過專家評委考核即擁有offer,每支隊伍至少一人確定通過;入職前Boss一對一指導,充分的技術方向選擇權;如為應屆博士生,直通DMT技術博士管培生項目終面。

(2)在校非應屆生:有機會直通JD京銳夏令營,優秀人才的最佳實習實踐。

2.比賽賽題講解

此次大賽可能會被評分公式給搞暈,對剛剛參加比賽的選手直接上手有一定難度。

我們先來看看比賽任務和提供的數據時間段:

比賽任務就是根據(用戶基本信息表、sku(商品)基本信息表、用戶行為信息表、用戶下單信息表以及評價信息表)這五張表建模。預測用戶在未來一個月是否會購買某個品類,就是說,預測一個月內,購買某個品類的概率。再其次是預測這個用戶,真實購買會是哪一天。

其實這題可以做兩個模型。第一個模型為:預測是否購買,然後按購買概率從高到低,排列用戶。第二個模型為:預測購買的用戶會是哪一天,一個迴歸的目標,你按購買用戶建模實際購買天數距離預測那天的距離,比如一天後購買,打上label 1,兩天後購買,打上label 2.然後每個用戶預測一個值,轉化為日期,提交結果。

我們先看看評分公式:

評分公式為兩個部分:第一個部分,就是用戶概率排序,記得是從大到小,wi實際上是概率的一個加權,概率越小的用戶給的權約小。

第二部分,是用戶購買天數距離,距離越近越小,如果用戶沒有購買,不產生得分。

3.去年jdata比賽有沒有參考價值

其實和去年賽題很相識,去年預測的是用戶是否會購買,以及會購買哪件商品。這次比賽預測的是否會購買哪個品類,以及購買的時間。去年大多數也都建立了兩個模型。


分享到:


相關文章: