2018 NAACL NLP國際大賽,先聲教育英語組榮獲第一

據美國18日消息,近日在由ETS等權威機構組織的2018 NAACL(自然語言處理國際頂級會議)second language acquisition modeling (SLAM) 大賽中,中國領先的人工智能企業先聲教育英語組榮登榜首,力挫劍橋大學、紐約大學、加利福尼亞大學等國際一流學術和產業界研究團隊。這不僅意味著先聲教育自適應系統已率先進入深度核心階段,更是中國邁入教育信息化2.0時代的強音。

奪冠國際語言處理頂級會議

NAACL是國際自然語言處理頂級學術會議之一, SLAM比賽的組織方為執管託福、GRE等國際考試服務中心ETS等權威機構,評委是有著“主動學習技術大咖”之稱的Burr Settles。本屆大賽吸引了來自世界各地幾十家頂尖學術界與產業界研究團隊,如University of Cambridge(劍橋大學)、New York University(紐約大學)等。

先聲教育CEO陸勇毅認為:“此次自適應大賽英語組獲得第一,除了先聲團隊自身的努力,也離不開各方的共同支持,如CMU和我們的戰略合作伙伴海雲天科技。”本次參賽的自適應學習技術,得到了Carnegie Mellon University (卡內基梅隆大學) 的多位教授指導。CMU為全球AI界頂級的學府,為全球輸出了許多頂尖AI人才,如李開復、陸奇、Andrew Ng等。海雲天科技是國內最大的考試服務商,服務中國教育信息化20餘年,擁有國際領先水平的產品系統和龐大的教育數據。早在2017年7月,先聲教育就和海雲天達成戰略合作,成立AI(人工智能)聯盟,以海雲天科技海量的教育大數據作為戰略性支持,共同搭建海雲天AI大腦。

此次大賽的具體運行過程需要對學習行為數據進行建模,目的是預估出未來學習中做題對錯的概率,評判標準為ROC曲線值(receiver operating characteristic curve)(AUROC值)。大賽的難點有二:一是語言類學習以詞彙、短語量龐大,語法、搭配複雜著稱,是自適應學習最難落地的學科,且本次大賽考察多個語種:英語、西班牙語、法語;二是學習行為數據時間跨度長達3個月,數據量極其龐大,超過1百萬個句子,6000多名學生,使學習行為的數學模型更加複雜。

比賽中先聲教育提交的模型ROC曲線值(AUROC)達0.86,英語成績排名第一。

English

參賽隊伍

AUROC

先聲教育

0.86

SanaLabs

0.86

NYU

0.85

Cambridge

0.85

UCSD

0.82

其他參賽隊

基線系統

0.77

率先邁入深度自適應技術階段,領跑“人工智能+教育”

自適應技術是一種決定性的面向未來的技術,在人工智能領域發揮著極其重要的作用。2017年人工智能首次寫入我國政府工作報告,上升至國家戰略高度。教育是人工智能最重要的應用場景之一,自適應技術的應用可通過對大量多次的學習行為數據進行建模,預估學生下週甚至下月做同類題,甚至是新知識點時,做對做錯概率,以達到預測學習的效果,直接指導將來的學習過程,可針對性適配每位學生,實現點對點的個性化教學,幫助學生得到均衡的教學資源。可以說,人工智能自適應教育是一次行業改革實驗,對機構、對學生、對老師三方都具有降本提效的價值,將把教育行業帶向成本更低、效率更高的人工智能時代。

先聲教育秦龍博士介紹,自適應學習可以分為兩個階段:1)以推薦系統為基礎的淺層自適應階段;2)以學習行為建模為基礎的深度自適應階段。目前國內大多數企業仍處於淺層自適應階段,從本次大賽英語第一的成果看,先聲教育自適應系統已成功率先步入自適應學習的核心深度階段。

未來的國際競爭說到底是人才的競爭,教育發展才是核心競爭力。先聲教育作為一家成立短短2年的人工智能創業公司,已完成數千萬級美金融資,並服務近百家行業頭部合作伙伴。面對未來教育變革和教育信息化2.0的升級趨勢,先聲教育CEO陸勇毅表示:“先聲教育作為一家人工智能企業,我們十分願意將每個階段的研究成果開放給國內外更多教育企業,助力更多國內企業,趕超國際水平。”


分享到:


相關文章: