科大訊飛機器閱讀理解技術再次登頂SQuAD挑戰賽

科大訊飛機器閱讀理解技術再次登頂SQuAD挑戰賽

繼2017年7月刷新世界紀錄後,近日,科大訊飛與哈工大聯合實驗室(HFL)再次在由斯坦福大學發起的機器閱讀理解領域權威評測SQuAD(Stanford Question Answering Dataset)中登頂。此次,訊飛與哈工大聯合實驗室提交的系統不僅在EM指標(精準匹配率)超過人類平均水平,併成為首個F1指標(模糊匹配率)上超過89%的系統。

科大訊飛機器閱讀理解技術再次登頂SQuAD挑戰賽

SQuAD挑戰賽最新成績榜單

2017年7月,科大訊飛憑藉交互式層疊注意力模型(Interactive AoA Reader)獲得該賽事的榜首,並在同年10月進一步優化該模型後再次刷新紀錄。此次訊飛與哈工大聯合實驗室提交的融合式層疊注意力系統(Hybrid Attention-over-Attention Reader)融合了近期學術界提出的諸多前沿技術,如基於上下文的文本表示、自適應轉隨機梯度下降的優化方法等,同時又研發出一些全新技術,不僅在SQuAD挑戰賽中取得亮眼成績,在其他自然語言處理任務上也獲得了顯著性能提升

科大訊飛機器閱讀理解技術再次登頂SQuAD挑戰賽

科大訊飛與哈工大聯合實驗室參賽提交系統一覽

機器閱讀理解技術目前已經成為多家知名企業、高校等研究機構關注的對象,技術上的突破將帶來自然語言理解的長足進步。在與其他研究機構和高校一同探索技術發展的同時,科大訊飛也在積極推動該項技術在對話、問答系統中的落地應用其中一個重要場景就是與智能車載系統的對話交互的結合,逐步實現汽車領域的精準問答通過讓機器閱讀汽車說明書及相關的介紹材料,使機器深度理解並掌握對該車型的相關知識;在用戶提出相關問題時,不僅能夠快速反饋給用戶相關章節,並且還能夠利用閱讀理解技術進一步挖掘並反饋更精準的答案,從而減少用戶的閱讀量,提高信息獲取的速度。

科大訊飛機器閱讀理解技術再次登頂SQuAD挑戰賽

科大訊飛執行總裁胡鬱在2017發佈會上介紹智能車載系統中閱讀技術的應用

科大訊飛不僅在SQuAD挑戰賽持續發力,也關注並積極推動中文信息處理的研究發展。2017年,科大訊飛攜手中國中文信息學會計算語言學專業委員會(CIPS-CL)承辦了第一屆“訊飛杯”中文機器閱讀理解評測(CMRC2017),發佈了相關中文閱讀理解數據集。今年,科大訊飛將繼續與中國中文信息學會計算語言學專委會共同舉辦第二屆“訊飛杯”中文機器閱讀理解評測 (CMRC 2018),進一步促進中文機器閱讀理解研究。

擁有廣闊應用場景的機器閱讀理解技術領域,未來將有怎樣的發展?

科大訊飛高級副總裁、AI研究院院長、認知智能國家重點實驗室主任胡國平表示,科大訊飛非常高興看到更多研究人員加入到機器閱讀理解技術的研究中來。前不久微軟亞洲研究院、阿里巴巴分別在EM指標上超過人類平均水平,並且有許多中國團隊在榜單中名列前茅,我們對中國研究機構在這個領域所取得的好成績表示祝賀。但同時,我們必須清楚地認識到,雖然目前的系統在SQuAD挑戰賽中超過了人類平均水平,但

並不能代表機器在機器閱讀理解任務上“完全”打敗了人類

他表示,真正的閱讀理解過程遠比我們想象的要複雜,以目前的技術水平還很難做到深層的推理和歸納。鑑於此,目前科大訊飛還在積極探索其他類型的閱讀理解,例如基於知識、常識的閱讀理解以及基於綜合線索的閱讀理解,並取得了一定的成績。相信在不久的將來,科大訊飛將在機器閱讀領域為大家展示更多的可能。


分享到:


相關文章: