這裡我們介紹一下京東的多輪對話系統挑戰賽。
比賽的網址為www.jddc.jd.com
比賽的首頁就是這樣的:
我們隊名是“昂鈦客AI”,目前的主要成員七人。
比賽有豐厚的獎金池,還可以學習到非常多的NLP相關知識。能取得一個好的名次的話,據說可以直接拿到京東的SP,其他好處自然是非常多的了。
昨天初賽正式開始,大概的數據如下圖所描述的那樣:
競賽所提供的環境包括終端,jupyter,tensorflow等,所提供的100G數據也都是隻讀文件,因此只能線上操作了。
其中初賽題目長這個樣子:
也就是說初賽是根據多輪對話預測一輪即可,而決賽則變成了每一輪都需要預測。如下圖:
seq2seq基線如下圖所示:文件中包含一些py文件和數據。
下圖是data文件夾下面chat.txt的數據,在這裡我們可以看到,數據比較符合我們日常生活中的對話,因此想要做好這個系統,還是有點難度的。
可見,難度直接上升了一個檔次。我們團隊的目的是要奔著第一去的(哈哈),有願意參與外圍支持的,也可以逐步一起學習真實的比賽資料和技術。
閱讀更多 數競之家 的文章