09.10 南京大學黃宜華:自動化機器學習AutoML 讓AI設計AI

以深度學習為代表的新一輪人工智能浪潮洶湧,同時,在大數據與超強計算能力的支撐下,正在不斷賦能產品、企業與社會,人工智能技術已經廣泛滲透眾多的垂直應用領域。作為最受矚目的AI技術,AutoML(Automatic Machine Learning, AutoML),自動化機器學習,即用機器去自動化的完成模型選擇和參數調優,讓模型設計自動化,替代人工方式進行模型設計的過程,從而大量節約人力,提高建模的效率。換言之,就是以AI設計AI,未來將有助於緩解目前AI開發者供不應求的局面。

AutoML在人工智能頂級編程人才匱乏的情況下應運而生,一般機器學習首先需要大量的訓練數據,再由機器學習工程師/數據科學家對數據進行分析,設計算法形成訓練模型;這需要大量的專業知識。如果使用AutoML,就像是在使用一個工具,只需要將訓練數據集傳入AutoML,那麼這個工具就會自動生成參數和模型,形成訓練模型,這樣即使不具備機器學習方面深入的專業知識也可以開發機器學習模型,它也有望縮短數據科學家用來創建模型的時間。未來預計會看到更多的商業AutoML軟件包、更龐大的機器學習平臺裡面整合AutoML。

2018年8月31日,作為“OFweek(第二屆)中國人工智能產業大會”的重點論壇之一的智能機器人專場論壇在上海跨國採購會展中心成功舉辦。本次專場論壇圍繞人工智能技術在機器人應用落地,就智能機器人的發展現狀、市場趨勢、技術難點等核心環節進行了多方分析與探討。

在本次論壇上,南京大學(PASA大數據實驗室)黃宜華教授發表了《自動化機器學AutoML研究進展》的主題演講。


南京大學黃宜華:自動化機器學習AutoML 讓AI設計AI

南京大學(PASA大數據實驗室)黃宜華教授


黃宜華教授為我們簡單介紹PASA(Parallel Algorithms Systems Applications)實驗室:作為國內高校最早從事大數據技術研究和教學的團隊,自2009年開始全面進入大數據領域,在分佈式大數據存儲和查詢、分佈式文件系統、大數據並行計算模式與系統、Hadoop/Spark/Alluxio性能優化與功能增強、分佈並行化機器學習和數據挖掘算法、大數據機器學習系統、大規模文本語義分析、大數據行業應用等方面展開了廣泛的研究,並與與業界多家企業達成合作。

算法模型、業務場景、計算力、數據資源結合大數據處理技術棧才能形成大數據智能分析應用,與互聯網一樣,大數據將有20年的發展週期,將孕育很多發展機遇,從2008的萌芽到如今的行業大數據應用需求普遍出現,基本分析應用發展落地階段,到未來的普及階段和成熟階段,大數據趨勢明顯。其強大的計算能力,已成為推動大數據時代人工智能技術和應用發展的動力,將大數據和人工智能機器學習推上了新一輪發展浪潮。

從谷歌推出的Google Cloud AutoML到開源AutoML系統AutoKeras、Auto-Sklearn、Auto-Weka,一系列的工具化與商業落地應徵了AutoML的強大適用性與商業價值。

更多精彩內容請查看OFweek(第二屆)中國人工智能產業大會--AI+機器人論壇”現場直播


分享到:


相關文章: