06.25 CCAI2018|機器也有詩與遠方——自然語言處理方法和應用

今年“兩會”期間,具有代表性的同聲傳譯產品給大眾留下了深刻的印象。時至今日,機器翻譯的新聞已屢見不鮮,剛剛過去的端午節(6月18日),IBM的Project Debater在一場人機辯論賽中展現了清晰的思維和出色的應對反駁能力,最終駁倒了人類。講道理,連伶牙俐齒的最佳辯手,都已經講不過機器了。

CCAI2018|機器也有詩與遠方——自然語言處理方法和應用

語言和文字是人類文明的載體。從人類誕生起,溝通需要語言,記錄需要文字,不同語系之間的交流還需要翻譯。語言作為人類智能最重要的標誌,如何用計算機來處理、理解和運用人類自然語言?是人工智能研究的核心問題之一,已有近百年研究歷史,具有重要的科學研究意義和產業應用價值。

自然語言處理(NLP)最早被人類用來解決機器翻譯問題,隨後進入搜索引擎應用、語義分析及大規模文本處理領域。在自然語言處理的發展過程中,計算機也領教到了人類語言的博大精深,比如對於國足水平這種送分題,也是要蒙圈的:“巴西隊誰也踢不贏,中國隊誰也踢不贏。”

在處理人類語言文字這種高維度、抽象化、靈活多變、界限模糊的非結構化數據時,計算機有著先天的劣勢。因此,NLP也被認為是人工智能領域最難解決的問題之一,比爾·蓋茨甚至將NLP形容為“人工智能領域‘皇冠上的寶石’”。

為了推進NLP領域的發展,科學家做了長期的艱苦努力,然而在很長一段時間內都收效甚微。上世紀90年代,人工智能已經能夠在自動控制、金融信息等領域輔助人類,可是,在完成簡單的文本翻譯和語音識別任務後,NLP領域的研究陷入了多年的停滯期。深度學習時代的來臨,重新加速了計算機語言與人類語言對接的進程。

如今,計算機已經在某些細分領域擁有理解和處理大規模文本的能力,我們平時使用的搜索引擎、智能翻譯、個性化信息推送和蘋果的Siri等產品都日臻成熟。甚至,今天我們在朋友圈看到的某些消息,已經很可能不是人類所撰寫的。2014年,美聯社開始使用AutomatedInsights公司的Wordsmith平臺自動編髮企業財報並生成新聞快訊。同時,騰訊的寫稿機器人DreamWriter自2015年上線以來,已經在體育、財經、娛樂等領域的新聞寫作多點開花,基本能夠在常規的快訊和新聞類報道中取代人類的工作。

本次的CCAI大會,自然不會錯過NLP這顆“皇冠上的寶石”。作為國內NLP領域頂尖學者,蘇州大學特聘教授,計算機學院副院長,人類語言技術研究所所長、國家傑出青年科學基金獲得者的張民教授將以《自然語言處理方法和應用》為題做專題講座。

什麼是自然語言處理和自然語言理解?其研究歷史、研究內容、研究現狀、研究方法、技術應用、產業需求、挑戰和未來的發展方向是什麼?近兩三年來,深度學習技術使很多人工智能問題的準確率得到顯著提升,那麼深度學習技術為自然語言處理帶來了哪些新的發展機遇?展望未來,NLP面臨的挑戰和發展方向是什麼?我們如何暢想與機器人對話的未來場景?以上這些,我們都將能從張民教授的報告中得到答案。


分享到:


相關文章: