京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

這裡我們介紹一下京東的多輪對話系統挑戰賽。

比賽的網址為www.jddc.jd.com

比賽的首頁就是這樣的:

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

我們隊名是“昂鈦客AI”,目前的主要成員七人。

比賽有豐厚的獎金池,還可以學習到非常多的NLP相關知識。能取得一個好的名次的話,據說可以直接拿到京東的SP,其他好處自然是非常多的了。

昨天初賽正式開始,大概的數據如下圖所描述的那樣:

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

競賽所提供的環境包括終端,jupyter,tensorflow等,所提供的100G數據也都是隻讀文件,因此只能線上操作了。

其中初賽題目長這個樣子:

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

也就是說初賽是根據多輪對話預測一輪即可,而決賽則變成了每一輪都需要預測。如下圖:

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

seq2seq基線如下圖所示:文件中包含一些py文件和數據。

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

下圖是data文件夾下面chat.txt的數據,在這裡我們可以看到,數據比較符合我們日常生活中的對話,因此想要做好這個系統,還是有點難度的。

京東多輪對話NLP比賽如火如荼,天南海北7個小夥伴如何一起參與?

可見,難度直接上升了一個檔次。我們團隊的目的是要奔著第一去的(哈哈),有願意參與外圍支持的,也可以逐步一起學習真實的比賽資料和技術。


分享到:


相關文章: