中國企業包攬主辦權,獎金池 12 萬美金,KDD Cup 2020 開賽

中國企業包攬主辦權,獎金池 12 萬美金,KDD Cup 2020 開賽

全球疫情嚴峻,各類賽事、會議能取消則取消,不取消的也紛紛改為線上進行,但學術頂會的步伐卻未因此受阻。近日,ACM SIGKDD 公佈了 KDD Cup 2020( 國際知識發現和數據挖掘競賽)的賽事安排。

KDD Cup 2020 將延續 2019 年的三個賽道:常規機器學習賽道、自動化機器學習賽道、強化學習賽道,阿里、Biendata 分別主辦了常規機器學習賽道的賽道一和賽道二,第四範式、滴滴則分別主辦了後兩個賽道,而第四範式也是連續第二年主辦自動化機器學習賽道。所有的比賽都將在 3 月-4 月進行,獎金池更是達到了 12 萬美金。

本次 KDD Cup 主席團中也有著兩張華人面孔:清華計算機系教授唐傑和滴滴技術副總裁葉傑平。唐傑曾任 KDD 2018 大會副主席,並獲得當年的傑出貢獻獎;葉傑平則從 2005 開始便成為 KDD 的常客,並在 2013 年獲得 KDD 最佳論文獎,而其和學生在 KDD 中過的論文總數超過 60 篇。

中国企业包揽主办权,奖金池 12 万美金,KDD Cup 2020 开赛

同時,ACM SIGKDD 和 KDD 2020 組委會也表示,將以參會者和志願者的健康、安全為首要考慮,在現行慣例之外,採取有效措施,根據疫情變化,探索可用方案,以保證賽事的有序進行。

KDD Cup 2020 賽項

• 常規機器學習賽道(ML 賽道 1) 「現代電子商務平臺挑戰賽」(於 2020 年 3 月 30 日開放)

• 常規機器學習賽道(ML 賽道 2) 「圖片對抗性攻防」(於 2020 年 4 月 15 日開放)

• 自動化機器學習賽道(AutoML 賽道) 「用於圖表示學習的 AutoML」(於 2020 年 3 月 30 日開放)

• 強化學習競賽賽道(RL 賽道) 「學習按需移動平臺上的調度和重定位」(2020 年 4 月 2 日開放)

常規機器學習賽道(ML 賽道 1)

賽道關鍵字:學習表示,遷移學習,圖像、視頻和文本處理

平臺:天池

總獎金: 40,000 美元

報名時間:UTC 2020 年 3 月 30 日至 2020 年 4 月 27 日。UTC 2020 年 4 月 27 日晚上 11:59 將關閉報名入口,並禁止換隊。

任務及評審標準:ML Track 1「現代電子商務平臺挑戰」賽項,要求參賽者通過考慮不同類型的複雜信息和模式之間的緊密聯繫,學習高質量的跨模式表達;然後,學習表示可用於計算表示之間的相似度得分,並選擇與文本相關的圖像/視頻;最後,每一次提交都將在測試數據集上進行評估,該數據集評估檢索到的產品與事實之間的對應關係。

此賽項有兩個分任務,任務 1 主題為「召回多模式實體」。

參賽者需要設計一個模型框架,以促進對圖像和視頻的有效語義理解、搜索和檢索,以便召回具有適當多模態內容的產品並對其進行排名,從而幫助消費者做出更好的決策。

召回多模式實體賽項詳情:

https://tianchi.aliyun.com/competition/entrance/231786/introduction?spm=5176.12281949.1003.4.2926539dVvsnc8

任務 2 主題為「消除偏見」。

由於指定目標(例如 ctr,cvr 或 gmv)帶來的算法偏見,將導致機器學習推薦系統產生嚴重的馬太效應,用戶將搜到曝光率更高的商品,從而導致推薦的不公平。因此,瞭解系統是否公平是至關重要的,也即「消除偏見」。

消除偏見賽項詳情:

https://tianchi.aliyun.com/competition/entrance/231785/introduction?spm=5176.12281949.1003.5.2926539dVvsnc8

常規機器學習賽道(ML 賽道 2)

賽項關鍵詞:生成對抗網絡(GAN),圖結構數據,圖嵌入

總獎金: 19,000 美元

平臺: Biendata

任務及評審標準:ML 賽道 2 「圖片對抗性攻防」賽項分為兩個階段。

在第一階段,將為所有團隊提供一個圖形數據集,然後要求參賽者以作為一種攻擊形式,提交該數據集的修改版本,修改後的數據看起來應與原始圖「相似」,但在競賽系統後端準備並保存的基準模型下分類精度較低。

在第二階段中,所有團隊都必須提交攻擊模型和防禦模型,塞方將發佈相似但不相同的圖形數據集。攻擊模型是一種算法,可以讀取圖形和防禦模型,並根據這兩個輸入來修改圖形。防禦模型是對圖進行穩健分類的模型。

評審標準:然後賽方將匹配所有團隊的所有進攻模型和防守模型。在每次比賽中,攻擊模型將首先修改圖,而防禦模型則將修改後的圖分類,比賽系統將記錄每次比賽的準確性。最後,每支球隊都會獲得兩個模型的準確性報告,然後以此作為排名依據。

ML 賽項 2 詳情地址:

https://biendata.com/competition/kddcup_2020/

自動化機器學習賽道(AutoML 賽道)

賽項關鍵字:圖表示學習,圖結構化數據,圖嵌入,AutoML

總獎金: 33,500 美元

平臺: CodaLab

任務及評審標準:AutoML 軌道「用於圖表示學習的 AutoML」是有史以來第一個應用於圖結構數據的 AutoML 挑戰。

在這一挑戰中,參賽者被要求搭建用於圖表示學習的 AutoML 解決方案,以自主地繪製圖形表示學習問題(無需任何人工干預),其中節點選擇分類作為評估學習表示質量的任務。

每個團隊都有三個公共數據集來開發 AutoML 解決方案,並提供六個反饋數據集,以使參與者能夠評估他們的解決方案。這些解決方案將在沒有人工干預的情況下使用六個看不見的數據集進行評估,優勝者將根據數據集的最終排名進行選擇。

AutoML 賽項詳情地址:

https://www.automl.ai/competitions/3

強化學習比賽賽道(RL 賽道)

賽道關鍵字:強化學習,按需機動性,車輛重定位

總獎金: 30,000 美元

平臺: CodaLab

任務及評審標準:RL 軌道「學習按需移動平臺上的調度和重定位」賽項要求:參與者應用機器學習工具來確定新穎的解決方案,重點考察點為如何應用機器學習解決方案來提高 MoD 平臺的效率。

其中包含了 2 個任務,即按需移動(MoD)平臺上的訂單分派(訂單匹配)和車輛重定位(車隊管理)。

任務 1 訂單分派要求團隊開發一種算法,實現在兩秒鐘的調度窗口內確定訂單驅動程序分配。其中,未完成的訂單(行程請求)和可用的驅動程序需要在窗口中進行批處理,它們的狀態信息將傳遞到訂單調度算法中。

在整個模擬中,將為每個調度窗口重複調用此模塊。評估模擬將運行多天,從中計算出平均駕駛員總收入,以此作為算法的得分。

任務 2 車輛重新定位要求團隊為預選的小型車輛開發一種重新定位算法。對於這些車輛中的任何一個,如果連續怠速時間超過 L = 5 分鐘的閾值,則該車輛可以重新定位。

環境會定期將所選組中所有合格車輛的狀態信息發送到重新定位算法,該算法指示駕駛員駛向特定目的地。模擬期間,參賽算法的平均個人收入率,被計算為該算法的分數。

這些算法將在團隊無法訪問的模擬環境中進行評估,除了環境所產生的分數之外。參與團隊可以選擇開發一種或兩種算法。

RL 賽道詳情地址:

https://outreach.didichuxing.com/competition/kddcup2020/

KDD Cup:數據挖掘的世界盃

KDD Cup 由美國計算機協會知識發現與數據挖掘專委會(ACM SIGKDD)發起,被稱為數據挖掘的世界盃,是該領域水平最高、影響力最大的頂級賽事。該比賽同時面向企業界和學術界,從 1997 年開始,每年舉辦一次,吸引了世界數據挖掘界的頂尖專家、學者、工程師前來參賽。

此外,KDD Cup 可以說是華人的主場。

中国企业包揽主办权,奖金池 12 万美金,KDD Cup 2020 开赛

2005 年楊強(右二) KDD Cup 奪冠照片

最早,2004、2005年,香港科技大學教授、IEEE Fellow 楊強曾帶領其團隊連續兩年拿下 KDD Cup 比賽冠軍。到了 2017 年,中國隊伍幾乎包攬了 KDD Cup 的所有獎項。

KDD Cup 強調應用,前期的承辦者多為高校,近十年則越來越多由企業贊助。與此同時,中國企業的出鏡率也越來越高。KDD Cup 2017 便曾由阿里雲承辦,百度、第四範式也贏得過 KDD Cup 2019 的主辦權。

2019 年,KDD Cup 有了獨立的議程,並首次設立 3 個賽道:Regular ML(常規機器學習)、Auto-ML(自動化機器學習)、Humanity RL(強化學習),其中強化學習的賽道為首次設立。三個賽道的冠軍分別被螞蟻金服和日本的 NTT DOCOMO 公司、深蘭科技和北京大學團隊、國立成功大學拿下。

雷鋒網.雷鋒網.雷鋒網


分享到:


相關文章: