重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

隨著技術和生態的不斷演進,應用場景的不斷探索,人工智能已然不再是空中樓閣。無論是日新月異的互聯網應用,還是求新求變的企業轉型,

機器學習都得到了廣泛的應用,逐步成為驅動業務的關鍵技術。作為Amazon Web Services家族裡的王牌成員,Amazon SageMaker 一出道便飽受關注,所以今天話不多說,小編趕緊來好好給大家介紹一下,這位機器學習重磅能手!

PS:後續還有更多精彩!敬請期待~~

彩蛋

驚喜預告:AWS機器學習解決方案架構師 — 王世帥 將於2020年4月30日晚上7點於嗶哩嗶哩直播平臺“AWS雲計算”官方賬戶上進行《“機器學習”並不難,使用Amazon SageMaker 易上手》主題直播,感興趣的童靴不容錯過~

Amazon SageMaker 前世今生

機器學習本身是一個高度協作的過程,將領域經驗與技術技能相結合是成功的基石,並通常需要多次迭代和實驗。相比預研項目或原型驗證,一個真正可以應用到生產環境的機器學習項目需要全面考慮工作流程的方方面面,包括數據預處理、框架部署與配置、算法選擇和優化、模型訓練和超參數優化、數據和模型安全、模型對於業務的可解釋性、模型 A/B 對比測試、模型部署後的持續監控和優化、不同硬件環境對模型編譯的要求、基礎資源的管理運維、總擁有成本優化等等。

為了解決這些問題,讓數據科學家、算法工程師、業務開發者都能輕鬆駕馭機器學習,AWS 於 2017 年 11 月推出了 Amazon SageMaker 機器學習平臺服務,並且在過去的兩年多里不斷豐富功能組件。在 Gartner 發佈的 2020 年雲上 AI 開發者服務魔力象限中,AWS 被評為領導者, Amazon SageMaker 是其中不可或缺的一部分。

2020 年 4 月30日,Amazon SageMaker 在由光環新網運營的 AWS 中國(北京)區域和由西雲數據運營的 AWS 中國(寧夏)區域正式開放。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

Amazon SageMaker 功能簡介

Amazon SageMaker 是一項完全託管的服務,可以幫助機器學習開發者和數據科學家快速構建、訓練和部署模型。Amazon SageMaker 完全消除了機器學習過程中各個步驟的繁重工作,讓開發高質量模型變得更加輕鬆。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

  • 構建機器學習模型

Amazon SageMaker Studio ——首個適用於機器學習的集成開發環境(IDE)

Amazon SageMaker Studio 是一個功能豐富的機器學習集成開發環境 (IDE) ,您可以在統一的可視化界面中操作 Notebook 、創建模型、管理模型試驗、調試,以及檢測模型偏差。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

Amazon SageMaker Notebooks 加快構建與協作

很多用戶使用單臺服務器運行 Jupyter Notebook ,不僅需要管理底層資源,而且在共享給其他用戶時,需要修改一系列系統配置以及網絡權限。Amazon SageMaker Notebook 可一鍵啟動 Jupyter Notebook ,AWS 負責底層計算資源的託管;同時還支持一鍵共享 Notebook,讓機器學習團隊輕鬆協作。

Amazon SageMaker Autopilot 實現模型自動構建與優化

在設計機器學習模型時,我們需要考慮可以用來解決機器學習問題的各種算法,找到有效的算法往往需要幾個小時的訓練和測試,甚至更長時間。

Amazon SageMaker Autopilot 可以自動檢查原始數據、選擇最佳算法參數集合、訓練和調優多個模型、跟蹤模型性能,以及根據性能對模型進行排名。如此一來,您可以大大縮短尋找最佳模型所需的時間。

Amazon SageMaker支持多種深度學習框架

支持的框架包括:TensorFlow、PyTorch、Apache MXNet、Chainer、Keras、Gluon、Horovod、Scikit-learn 和 Deep Graph Library。

除了默認支持的框架,其他任何框架可以通過自帶容器(BYOC,Bring Your Own Container)的方式在Amazon SageMaker中運行,包括模型訓練和部署。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

  • 訓練機器學習模型

Amazon SageMaker Experiments 組織、跟蹤和評估訓練運行情況

模型訓練需要多次迭代和不斷調優,包括嘗試不同算法、超參數、調整選取的特徵等。Amazon SageMaker Experiments 通過自動捕獲輸入參數、配置和結果將其存儲為“實驗”來幫助您管理迭代。您還可以使用 Amazon SageMaker Studio 的可視化界面來瀏覽進行中的實驗,與先前的實驗及結果進行直觀的比較與評估。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

Amazon SageMaker Debugger 分析、檢測和提醒與機器學習相關的問題

目前大多數機器學習流程是不透明的,而且訓練模型所花費的時間較長,這些都是優化過程裡的障礙。Amazon SageMaker Debbuger 能在訓練期間自動捕獲實時指標(如混淆矩陣和學習梯度等),讓訓練流程更加透明,最終提高模型精度。Amazon SageMaker Debugger 還會對常見問題發出告警並提供修復建議。藉助 Amazon SageMaker Debbuger ,您可以更好地理解和解釋模型工作原理。

AWS 運行 TensorFlow 的最佳平臺

AWS 提供了針對 TensorFlow 的優化。在 256 個 GPU 的集群擴展效率測試中,AWS 優化的 Tensorflow 的擴展效率高達 90 %,而默認的開源版本只有 65 %,您可以通過 Amazon SageMaker 輕鬆開啟高效的分佈式訓練,大大縮短訓練時間。

降低訓練成本

Amazon SageMaker 支持基於託管的 Spot 競價實例進行訓練,訓練成本降低最多可達 90 %,並且,Amazon SageMaker 支持週期性自動保存 checkpoint 以避免 Spot 實例中斷引起的重複訓練。

  • 部署機器學習模型

一鍵式部署

Amazon SageMaker 支持一鍵部署模型,針對實時或批量數據生成預測。您可以跨多個可用區在自動擴展的實例上一鍵部署模型,在實現高冗餘的同時無需做任何基礎設施運維操作。Amazon SageMaker 自動管理計算實例和模型部署,併為 API 訪問提供安全的 https 終端節點。您的應用程序只需要調用這個 API 接口就可以實現低延遲、高吞吐量的推理。

Amazon SageMaker Model Monitor 讓模型保持精確

由於訓練數據的限制,模型部署之後的一個常見問題是,當目標變量隨著時間推移發生改變,模型會不再適用。這個問題稱為概念漂移(concept drift)。例如,經濟環境變化可能會推動新利率出臺,從而影響一個購房模型的預測結果。Amazon SageMaker Model Monitor 能夠檢測已部署模型的概念漂移(concept drift),並提供詳細的警報,幫助確定問題根源。同時,通過 Amazon SageMaker 訓練的模型會自動發送關鍵指標,您可以在 Amazon SageMaker Studio 中收集和查看這些指標。這個功能也為一些訓練數據有限的場景提供了一個自動化機制,方便通過線上數據不斷調優模型,而不必因為沒有收集到足夠數據或缺少自動化流程而推遲模型部署。

與 Kubernetes 集成以進行編排和管理

許多機器學習團隊的現有工作平臺是基於運維團隊搭建的 Kubernetes 平臺的,而且有一些現有工作流編排和應用不易遷移。Amazon SageMaker 充分考慮到了這一點,並提供了 Kubernetes Operator 來與基於 Kubernetes 的工作流集成。也就是說, Amazon SageMaker 不僅是一個全面的機器學習平臺,而且可以通過 Kubernetes Operator 與您現有的平臺集成。

Amazon SageMaker Neo 一次訓練,多處運行

Amazon SageMaker Neo 讓機器學習模型訓練一次即可在雲上或者邊緣計算節點中的不同硬件和系統環境中運行。Amazon SageMaker Neo 優化的模型運行速度最多可提高兩倍,並且所消耗的資源不到典型機器學習模型的十分之一。Neo 使用了包括 Apache TVM 在內的兩種編譯器,並且已經開源(
https://github.com/neo-ai/),讓您可以更加靈活地針對不同設備和應用定製軟件。

Amazon SageMaker 客戶案例

  • NFL(美國國家職業橄欖球大聯盟)

通過利用 AWS 廣泛的機器學習服務,NFL 將其比賽日的數據分析提高到了一個新水平,球迷、廣播員、教練和球隊可以受益於更深入的數據分析。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

NFL(美國國家職業橄欖球大聯盟)是美國最大的體育運動聯盟,在全球擁有超過 1.88 億的球迷。每場精彩比賽的背後都有成千上萬個您可能會錯過的數據點,例如運動員的速度,在場地的位置和移動方式。NFL 開發了一個名為下一代統計數據(Next Gen Stats)的系統,藉助 AWS 機器學習和人工智能技術,NFL 提供了現場比賽數據的可視化,並挖掘更深刻的見解。

“藉助 AWS 上的機器學習能力,我們可以更好地瞭解球迷的參與度、比賽的呈現方式、調整比賽規則的潛在影響、比賽的方式以及球員的表現和安全。Next Gen Stats 使我們能夠利用這些實時數據,以全新、獨特方式來吸引球迷,向球迷傳遞信息。” NFL 高級副總裁兼首席信息官 Michelle McKenna 通過與 AWS 的專業服務團隊合作,Next Gen Stats 團隊使用 Amazon SageMaker 創建和部署了機器學習模型。這些模型使用傳統統計數據、球員跟蹤數據和球員資料的作為輸入,Next Gen Stats 改變了橄欖球的分析、比賽、執教和體驗方式。

為了獲得實時見解,來自體育場的數據將流式傳輸到 AWS。一旦進入 AWS,數據將在一秒鐘之內經歷 100 多個流程,最終為體育播音員提供更多可談論的獨特數據點。Next Gen Stats 的最大收益之一就是改善了球迷體驗。除了傳球成功概率之外,NFL 還建立了一些新的統計模型,例如接球后預期碼數、QB 風險指數和衝陣效率等。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

  • 大宇無限

藉助 Amazon SageMaker、Amazon Rekognition 等 AWS 機器學習服務,大宇無限實現了視頻審核和推薦的自動化,可以給用戶提供穩定、可靠且高質量的視頻服務。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

深圳大宇無限科技有限公司(以下簡稱“大宇無限”)是一家專注於移動互聯網應用的創業公司, 2016 年初成立,團隊主要成員來自北京大學、香港科技大學、UCLA、Emory 等國內外知名高校,具有一流互聯網公司從業背景。大宇無限每月為全球超過 1 億的用戶提供服務。

移動短視頻服務是大宇無限的主要業務方向之一,移動短視頻服務包含在線視頻推薦服務,需要構建機器學習系統,從設計架構、建立訓練模型、選擇算法和框架到最終部署到生產系統中,整個流程極為複雜,需要大量的開發人員耗費很長的時間才有可能完成。藉助 AWS 在機器學習領域的一系列雲服務,大宇無限快速完成了整個系統的開發和部署,實現了快速起步、為用戶提供高質量短視頻服務的目標。

“在大宇無限的產品中實現視頻內容的在線推薦對我們的開發團隊來說是一個巨大的挑戰,Amazon SageMaker 極大地簡化了機器學習系統的構建、訓練和部署流程,使我們僅用了 3 個月就完成了整個系統的建設並承受了實際用戶訪問的壓力,實現了從 0 到 1 的突破。”大宇無限技術副總裁劉克東。

  • 華來科技

藉助Amazon ECS、AWS Lambda、AWS IoT Core、Amazon SageMaker等在內的雲服務,為自身產品與解決方案的研發提供了安全可靠、覆蓋全球的技術支撐,也為企業帶來了一系列顯著收益。

重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

天津華來科技有限公司(以下簡稱“華來科技”)是一家集智能家居、智慧安防電子產品的研發、生產和銷售為一體的高新技術公司。自 2015 年成立以來,始終秉持“做價格厚道、感動人心的產品”的價值觀,一直致力於為用戶提供“簡單、易用”的智能家居和智能安防產品及解決方案。

隨著海外市場的快速擴張,用戶數量持續增長、設備訪問量劇增,華來科技急需在傳統硬件設計和生產之外創造更多的業務增長點。在這樣的需求下,華來科技希望構建起一個由“硬件”+ “APP”+“後端服務”所組成的智能安防與智能家居服務平臺。該平臺需要具備良好的擴展性,並通過智能服務,更好地滿足各地域用戶的不同需求。要實現這樣的願景,華來科技需要快速搭建大數據處理平臺,藉助大數據處理技術精準地瞭解用戶需求,優化建設成本,並縮短產品上市時間,以應對市場的激烈競爭。

“藉助 AWS IoT Core 服務平臺,我們完成了從邊緣到雲端物聯網設備管理的轉變;研發人員通過 Amazon SageMaker 進行機器學習模型搭建及算法訓練,在傳統安防攝像監控的基礎上成功實現AI的視頻場景與人物分析;Amazon ECS 的應用也改變了傳統的部署方式,在提升業務平臺穩定性和彈性的同時為我們節約了近 30 %的運營成本。”天津華來科技有限公司 Cloud 業務部總監季寶平。

  • 採用Amazon SageMaker的部分客戶
重磅!AWS家族王牌成員Amazon SageMaker現已在中國區上線

動手實踐Amazon SageMaker

Amazon SageMaker 服務目前已在由光環新網運營的 AWS 中國(北京)區域和由西雲數據運營的 AWS 中國(寧夏)區域上線,以下鏈接中的教程將指導您學習 Amazon SageMaker 的模型構建、訓練和部署,利用這些資源幫助您快速地從概念轉向生產。


分享到:


相關文章: