07.27 微軟AI Lab:助你從零開始成為AI開發者

微軟AI Lab:助你從零開始成為AI開發者

編者按:AI Lab是微軟在Build 2018大會上發佈的人工智能開放項目平臺,向開發者展示微軟最新AI技術的使用案例。微軟希望AI Lab能幫助全球的開發者運用微軟豐富的開放資源和平臺來探索自己的人工智能項目。本文翻譯自微軟研究院機器學習博客“AI Lab: Learn to Code with the Cutting-Edge Microsoft AI Platform”,有刪減。

在今年的Build大會上,微軟推出了人工智能開放項目平臺——AI Lab,旨在幫助規模龐大且正在快速增長的開發者隊伍來探索、學習和使用微軟AI平臺的最新技術,探索自己的第一個人工智能項目。

微软AI Lab:助你从零开始成为AI开发者

AI Lab目前開放了五個人工智能項目,展示了微軟自定義視覺服務(Custom Vision Service)、AttnGAN、Visual Studio Tools for AI、Cognitive Search、機器閱讀理解等最新技術的使用。在每個項目中,開發人員都可以訪問GitHub上的開源代碼,嘗試Demo演示,還可以觀看清晰的介紹視頻,從而獲得對人工智能潛在的商業問題和解決方案的深入理解。

繪畫機器人

繪畫機器人(DrawingBot)是由微軟研究院人工智能實驗室的研究人員開發的,能根據文本信息繪製出相應圖像的模型。DrawingBot的核心技術是GAN網絡(Generative Adversarial Network),其中包含兩個機器學習模型,一個模型根據文本描述生成圖像,另一個模型用文本描述去鑑別生成圖像的真實性。如果生成的圖像和文字描述相差甚遠,就無法通過鑑別模型的檢測,因此GAN網絡通過兩個模型的合作,能夠使生成的圖像越來越接近本文所描述的內容。然而,GAN網絡對“一隻藍色的鳥”、“一棵常青樹”這樣比較簡單的文字描述能生成效果較好的圖像,而對於“一隻綠冠紅腹、黃色翅膀的鳥”這樣複雜的描述,生成的圖像還不那麼盡如人意。

想象一下,如果讓我們來根據一段描述畫一幅畫,我們會怎麼做?通常來說,我們會在這個過程中不斷地參考文本描述,尤其是正在繪製的區域所對應的那部分文字。基於這個啟發,研究人員將GAN網絡改進為AttnGAN網絡(attentional GAN),用數學表達來模擬人類的這種注意力特徵,將輸入的文本分解為單個的單詞,將單個單詞與待生成圖像的特定區域相匹配。根據CVPR上的一篇研究論文的測試結果,這種方法使生成圖像的質量提高了近三倍。

微软AI Lab:助你从零开始成为AI开发者

項目鏈接:

https://www.ailab.microsoft.com/experiments/1e9e1eef-2ab1-41f1-b341-0118f414bd78

微软AI Lab:助你从零开始成为AI开发者

JFK文件演示

為了幫助用戶更好地瞭解美國總統肯尼迪被暗殺的整個事件,微軟的研究人員利用Azure搜索服務和微軟認知服務開發了一個應用程序,能夠自動分析與暗殺有關的所有解密文件,並將原始文檔整理成結構化的信息。

JFK文件演示背後的核心技術是Cognitive Search,這是微軟在Build大會上發佈的一項基於AI的內容理解技術,由內置認知服務功能的Azure搜索提供支持,能從任何內容資源中提取數據,並運用可組合的認知功能從數據中提取需要的知識。這些知識將被整理和存儲在索引中,優化搜索數據的體驗。Cognitive Search能方便快捷地利用雲和AI的強大力量處理數據,當我們第一次將它應用於JFK文件演示系統時,效果令人驚歎,我們提出的許多有趣的問題不僅可以獲得回答,還可以在原始文件中看到答案和問題之間的關係。JFK文件演示系統能使我們的客戶輕鬆將其應用到自己的領域、回答他們所需要的問題。

微软AI Lab:助你从零开始成为AI开发者

項目鏈接:

https://www.ailab.microsoft.com/experiments/7d6b0652-51dc-440d-a12a-481f28525143

風格遷移

風格遷移(Style Transfer)是一種對圖片風格進行轉換的技術,能從一張圖片中提取出風格並應用到另一張圖片中,也就是我們常見的“濾鏡”功能。這個項目展示瞭如何訓練和部署深度學習模型,開發一個簡單有趣的風格遷移應用。

微软AI Lab:助你从零开始成为AI开发者

風格遷移項目使用Visual Studio Tools for AI來訓練和部署深度學習模型。Visual Studio Tools for AI能讓開發者在本地開發機器上輕鬆部署Keras + Tensorflow模型的訓練代碼,然後上傳到Azure VM上,利用強大的Nvidia GPU來訓練模型,大大提高工作效率。我們在提高模型訓練速度的同時,在生成圖像中保留了與原始圖像的語義相似性。此外,Visual Studio Tools for AI還能直接從訓練好的TensorFlow模型生成C#代碼,無需再手動重新編寫。使用全新的Microsoft.ML.Scoring庫,開發者可以便捷地在應用中使用TensorFlow或ONNX模型,在設備端或者雲端運行。

微软AI Lab:助你从零开始成为AI开发者

風格遷移只是採用訓練機器學習模型方法的應用之一,在應用中使用機器學習技術的過程本質上是相同的。開發者可以使用Tensorflow或CNTK等框架自行訓練模型,也可以使用Azure認知服務等預先訓練的AI模型。

項目鏈接:

https://www.ailab.microsoft.com/experiments/99907c05-d487-450b-9ee9-901b40205e81

機器閱讀理解

機器閱讀理解(MRC)是讓計算機根據給定的上下文來回答問題,需要對上下文和問題之間的複雜交互進行建模。微軟的研究人員採用新的神經網絡ReasoNet(Reasoning Network)來模仿人類閱讀時的推理過程:ReasoNets會帶著問題反覆閱讀文檔,每次關注文檔的不同部分,直到給出令人滿意的答案。

微软AI Lab:助你从零开始成为AI开发者

同時,微軟亞洲研究院的研究人員也提出一種獨特的R-NET算法,使機器閱讀理解能力在SQUAD數據集上超越了人類平均水平。R-NET是一個端到端的深度學習模型。模型分為四層,最下面一層給問題和文本中的每一個詞做一個表示,即深度學習裡的向量;第二步,將問題中的向量和文本中的向量做一個比對,找出與問題接近的文字部分。接下來,將結果放在全局中進行比對。這些都是通過注意力機制(attention)達到的。最後一步,針對挑出的答案候選區中的每一個詞彙進行預測,哪一個詞是答案的開始,到哪個詞是答案的結束。這樣,系統會挑出可能性最高的一段文本,最後將答案輸出出來。

當我們將這些機器閱讀理解算法用於由沈向洋和Brad Smith撰寫的《未來計算:人工智能及社會角色》一書時,機器閱讀理解回答了大量有趣的問題。機器閱讀理解技術能夠應用於企業級數據處理,幫助客戶回答特定領域的問題。

微软AI Lab:助你从零开始成为AI开发者

項目鏈接:

https://www.ailab.microsoft.com/experiments/ef90706b-e822-4686-bbc4-94fd0bca5fc5

Drones + AirSim

Drones + AirSim是一項有趣的模擬“搜索與拯救”的任務。我們先在AirSim中創建了一個3D環境來模擬微軟園區中的足球場,將各種動物放置在球場中;創建了一個Python腳本模擬無人機,它可以在球場中自由拍攝照片。然後我們將無人機拍攝的圖像上傳至Azure自定義視覺(Custom Vision)服務,訓練模型來識別圖像中的動物,利用Azure IoT Edge將訓練好的模型部署到無人機上。於是,無人機能夠在足球場中飛行、拍照,並實時識別出畫面中的動物。這一項目能夠讓用戶瞭解實時自定義的AI如何在無人機這樣的邊緣設備上運行。

微软AI Lab:助你从零开始成为AI开发者

項目鏈接:

https://www.ailab.microsoft.com/experiments/92262b36-de2e-444e-86ca-8bcb8bd02454

微软AI Lab:助你从零开始成为AI开发者

AI Lab即將開放社區申請,我們希望更多的開發者能夠參與進來,學習和使用微軟最新的AI服務和平臺。點擊閱讀原文即可訪問AI Lab。

歡迎在留言區寫下你對微軟AI平臺的想法!

你也許還想看

微软AI Lab:助你从零开始成为AI开发者

感謝你關注“微軟研究院AI頭條”,我們期待你的留言和投稿,共建交流平臺。來稿請寄:[email protected]


分享到:


相關文章: