NLP最新科研福利!MSRA開源學術界最全面語義分析數據集

雷剛 發自 凹非寺

量子位 報道 | 公眾號 QbitAI


NLP最新科研福利!MSRA開源學術界最全面語義分析數據集


微軟亞洲研究院(MSRA),剛剛送出最新一批AI資源和福利。

在“中國高校人工智能人才國際培養計劃”2019國際人工智能專家論壇暨2019微軟新一代人工智能開放科研教育平臺合作論壇,MSRA面向高校提供最新的人工智能技術、工具、科研成果,以及數據集。

詳情如下:

平臺:

OpenPAI支撐全國高校的人工智能科研與教學

由微軟推出的Open Platform for AI(OpenPAI)人工智能管理和調度平臺,是國內首個針對深度學習領域由多方共同開發的開源平臺解決方案。

在新一代人工智能開放科研教育平臺的合作框架下,OpenPAI已幫助多所高校與科研機構建立了屬於自己的人工智能基礎支撐平臺,其開放、開源、兼容、穩定的特性,模塊化的系統架構和豐富的資源為高校常見的異構IT環境以及高校教師在人工智能領域的創新和教學提供了強有力的支撐。

其中,中國科學技術大學的“類腦智能技術及應用國家工程實驗室“(NEL-BITA,下文簡稱“類腦實驗室”),就是基於OpenPAI搭建的一個開放、共享的科研教育平臺。

並已經在真實的科研、教育場景中進行應用。類腦實驗室首先利用OpenPAI整合了其1040塊品牌、型號各異的GPU顯卡,為上層應用提供底層IaaS(Infrastructure as a Service,基礎設施即服務)支撐。

然後類腦實驗室在OpenPAI上自主開發了類腦雲OS作為PaaS層(Platform as a Service,平臺即服務),保障大量人工智能科研、教育應用的開發和運行。

最後,類腦實驗室在最上層搭建了bitahub社區,供本校以及兄弟院校的師生髮布其研究成果、數據、論文等。

2019年,微軟亞洲研究院將繼續提升OpenPAI的用戶體驗、核心深度學習能力支持、調度系統的可擴展性以及系統穩定性,並與合作高校進一步以OpenPAI為基礎進行深度學習算法和系統相關的研究,包括自動化機器學習算法、分佈式深度學習、自動化網絡壓縮、自動深度神經網絡搜索以及GPU調度算法等。


NLP最新科研福利!MSRA開源學術界最全面語義分析數據集


工具:

集人工智能研究開發實用工具之大成

在新一代人工智能開放科研教育平臺上,微軟將其在語音、語言、視覺、機器學習、數據挖掘、數據可視化等核心技術範疇內的開源工具進行了整合,如自動化機器學習工具包NNI(Neural Network Intelligence)、輕量級機器學習算法LightGBM、信息圖設計工具Infographic Designer和高分辨率網絡工具包HRNet(High-Resolution Network)等,與各高校分享,並且集成了各高校在各自領域裡的優質開源工具,從而形成能夠服務教師與學生的強大的人工智能集成開發環境。

這些人工智能相關的開放開源工具和集成開發環境,讓高校師生有效地提升了研究開發效率,不必顧慮技術之間的兼容、轉化等問題,降低了人工智能領域技術的學習成本,更加專注於自己的研究領域,更高效地完成人工智能科研和教學工作。

不僅如此,這些工具還讓教師和學生們可以輕鬆地開發、測試和部署人工智能解決方案,靈活運用人工智能領域的核心技術解決金融、醫療、教育等行業中的關鍵問題,讓科研成果產生更大的價值和影響力。

新的一年,微軟亞洲研究院將在自動化機器學習工具、深度學習開發工具,以及以此為基礎的人工智能教育等方面加大投入。

同時,以PAI for VS Code等工具和OpenPAI為基礎,微軟亞洲研究院將為高校提供Azure+OpenPAI的部署方案和免費的Azure教學資源,讓教師們可以以更快速且低成本的方式部署人工智能實驗,讓學生們可以在世界一流的平臺上練習人工智能實戰技能。


NLP最新科研福利!MSRA開源學術界最全面語義分析數據集


數據:

新增業界最全面的語義分析數據集

在新一代人工智能開放科研教育平臺的合作框架下,微軟開放了自身人工智能領域的數據集供合作高校在科研和教育工作上進行引用,如微軟機器閱讀理解(MS MARCO)、微軟研究院社交媒體對話語料庫、18K數學文字題測試集SigmaDolphin等。

高校也通過平臺貢獻了各自在多個領域的數據集,如中國科學技術大學類腦實驗室的海量類腦數據等。

2019年,微軟亞洲研究院正式發佈自然語言處理(NLP)領域全新的語義分析數據集MSParS (Multi-perspective Semantic ParSing Dataset)。

作為智能音箱、搜索引擎、自動問答和對話系統等人工智能產品中的核心技術,語義分析(Semantic Parsing)面臨著因人工標註代價高昂而導致的數據缺乏問題,目前已有的語義分析數據集在數據規模和問題類型覆蓋度上非常有限。

為此,微軟亞洲研究院提出並構建了 MSParS,該數據集(1.0版本)包含81,826個自然語言問題及其對應的結構化語義表示,覆蓋12種不同的問題類型和2,071個知識圖譜謂詞,是學術界目前最全面的語義分析數據集。未來,微軟將與各高校一起開放、共享更多數據,促進產教融合合作生態的建設。

課程與實踐分享:

讓人工智能人才數量呈指數級增長

培養與時俱進的新時代科技人才是新一代人工智能開放科研教育平臺的三大使命之一。

平臺採用課程共建和師資培訓的形式,為高校教師提供了來自微軟和高校專家多年積累的人工智能實踐和前沿的技術知識,並通過教師們的教學內容和平臺課程進一步與學生們分享理論知識,並培養其實踐能力。

過去一年,微軟亞洲研究院組織了多場人工智能教育實踐研討會,惠及全國2000餘位高校教師。

30多個由微軟亞洲研究院與高校合作設計的高質量課程,讓超過5萬名學生從中受益。

依託新一代人工智能開放科研教育平臺,微軟亞洲研究院還成立了微軟人工智能教育與學習共建社區(下文簡稱“社區”), 旨在打造聚合高質量資源、全生態教學、開放式學習為一體的人工智能學習、實踐、共享平臺。

目前,社區已有來自100多所高校的200多名成員加入。

關於新一代人工智能開放科研教育平臺

為響應教育部《高等學校人工智能創新行動計劃》的號召,大力支持教育部“中國高校人工智能人才國際培養計劃”。

2018 年微軟亞洲研究院聯手中國高校共建新一代人工智能開放科研教育平臺(以下簡稱“智新平臺”),面向所有中國高校提供技術平臺、工具與應用、數據、課程與實踐這四大核心資源和服務。

並圍繞它們開展聯合科研、課程共建、師資培訓、實習實訓和國際交流等各項合作。

經一年的持續建設和提升,智新平臺不斷完善其教育合作體系,發展出了以“基礎支撐”、“學習理念”、“實踐案例”、“共建社區”、“打造‘金課’”、“協同育人”、“開放科研”七個維度為核心的工作佈局。

同時彙集企業與高校優勢資源,以期在更廣範圍打造人工智能教育領域的共贏生態。

傳送門

MSParS數據集:

https://github.com/msra-nlc/MSParS

— 完 —

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回覆“招聘”兩個字。

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態


分享到:


相關文章: