對人工智能現狀的反思:2018年科技頭條網

對人工智能現狀的反思:2018年

2019-02-15 18:03:20 AI中國

點擊上方關注，All in AI中國

這篇文章由Alex Stern和Eugene Sidorin共同撰寫。

每天我們的郵箱裡都會大量的堆積與人工智能相關的新聞，每週都會有幾十篇的文章、意見、概述的標題中都會出現“人工智能”的字樣。然而，並非所有的聲稱與人工智能相關的內容都是有意義的或相關的，而且，通常與該領域完全沒有任何關係。

為了使機器學習、神經網絡和人工智能的其他部分的知識民主化，我們決定通過創建一系列重點文章來開展我們的工作，這些文章將涵蓋該領域的最新進展，看看主要參與者，並提供一些有關最有前景的技術的見解，以及該行業當前面臨的機遇和困境。

在這一篇文章中，我們簡要概述了我們在2018年看到的關鍵發展，按主要貢獻者、應用和挑戰進行細分。

如今，有數百家公司都深入參與了人工智能領域，並試圖弄清楚他們與該領域相關的戰略，目前，可能比較難以確定最有能力引領未來發展方向的特定參與者，但我們看一下眾多參與者列表中的一些，谷歌、Facebook、亞馬遜、微軟和IBM，似乎最終在各式樣的大事件中不可避免的會看到這些名字，（其他幾乎同樣經常被提及的公司還有蘋果(Apple)、騰訊(Tencent)和百度）。在本文中，我們會重點關注微軟和谷歌，與2018年一樣，它們經常會出現在有關人工智能的新聞中。

谷歌

來自Google博客的Google Pixel：Night Sight功能演示

拿Google在AI領域的努力來說，這是一個富有成效的一年，公司推出的新產品數量以及對現有服務的一些重大改進都證明了這一點。

公告數量最多的是谷歌I/O，該公司在5月舉行了年度開發者大會。除此之外，谷歌還推出了Smart Compose for Gmail，為谷歌地圖做了一些非常令人印象深刻的更新，也許最重要的是，它宣佈推出了新的人工智能虛擬助手，稱為Google Duplex（參見所有新產品和功能的一個很好的總結）在2018年的谷歌I / O上推出）。

用公司自己的話說：

“[Google Duplex]是一種新技術，通過電話執行”真實世界“任務用於進行自然對話。該技術旨在完成特定任務，例如安排某些類型的約會。對於這樣的任務，系統會使對話體驗儘可能自然，讓人們能夠像對待他人一樣正常說話，而不必適應機器。“

由Duplex製作的美髮沙龍的電話記錄非常令人印象深刻，甚至引起了一些人質疑Google Duplex是否通過了圖靈測試（提示：它沒有;至少，做出判斷的人必須意識到她可能正在和一臺機器說話。它還引發了一場激烈的討論，即如何以這種方式使用技術，而不讓接收端的人知道他們沒有與真正的人交往，而是與機器人交談。雖然最終可能很難回答這些問題，但我們可能很快就會看到更多這樣的討論，因為谷歌在去年12月開始向其部分智能手機推出了Duplex。

來自谷歌的另一個有趣的更新來自他們的Pixel系列智能手機（Pixel 3和3 XL）的最新更新，它帶來了一些非常令人印象深刻的AI的新相機功能。

最後，由Alphabet公司全資擁有的DeepMind Technologies憑藉其AlphaZero計劃的最新版本成功實現了一個重要的里程碑。

我們已經在2015年和2016年的Go遊戲中看到了AlphaGo和AlphaGo Zero的令人印象深刻的成就，當時它在與兩個最強的圍棋冠軍競爭時輕鬆贏得了大多數比賽;然而，在2018年，DeepMind的團隊成功實現了一些更有趣的東西，最新的AlphaZero引擎展示了它在國際象棋、棋牌和圍棋中的明顯優勢。

AlphaZero特別有趣的是它設法實現了這一壯舉，而無需研究人類所玩遊戲的任何日誌;相反，在只提供基本規則的情況下，該程序自學瞭如何玩三個遊戲。事實證明，AlphaZero不受以往遊戲學習的限制，採用了一種不同於以往任何遊戲的“突破性、高度動態和“非常規”的遊戲風格”。這反過來又使得引擎對社區更有用，然後社區可以通過觀察機器開發的策略來學習新的策略。鑑於AlphaZero能夠從頭開始成功學習並解決完美的信息問題，它還為未來的這項技術創造了實際應用的承諾。

DeepMind還致力於創建可以處理不完美信息問題的系統，因為它最近在 AlphaStar 中成功擊敗了星際爭霸II中的一些職業玩家（而在過去，由於遊戲的原因，AI一直難以成功地玩《星際爭霸》)就證明了這一點。）

微軟

微軟Azure營銷公司副總裁Julia White在舊金山舉行的人工智能事件對話中發表演講

與谷歌類似，微軟在全力開發人工智能遊戲的過程中，曾在2018年推出了大量與人工智能相關的新產品和服務，並改進了一些基礎技術。這項工作的一個重要部分是以社區為中心，專注於為開發人員提供更好的工具和功能，以便在Microsoft的雲平臺上構建基於AI的解決方案。

有趣的是，微軟Build的開發者大會在5月份發生，就像谷歌一樣。在2018年，它一直是微軟的盛會，該公司正在發佈了大量新公告，特別是宣佈了項目Brainwave與Azure機器學習的集成。

Brainwave項目（最初被稱為Catapult）是從2010年Bing開始的幾年研究的結果。Mombwave於2017年8月在熱門的芯片大會上向公眾宣佈的，其中一個是半導體頂級會議。簡而言之，Brainwave是一個基於FPGA芯片上的硬件平臺，旨在加速實時AI計算，這是搜索引擎等服務的關鍵領域（這也解釋了為什麼這個項目來自Bing）。現在，隨著Brainwave與Azure機器學習的集成，微軟聲稱Azure是最有效的人工智能雲平臺。

在去年9月在奧蘭多舉行的另一場大型會議Ignite上，微軟為企業開發人員發佈了Cortana Skills Kit，便於他們使用現有的亞馬遜 Alexa 助手技能代碼來構建 Cortana 技能。想想你可以為機器人編程以便能夠為辦公室安排好清潔服務，或者在您的簡短語音命令的指導下就將需求自動提交到服務檯。

幾天後，微軟還宣佈將實時翻譯功能整合到SwiftKey中，這是一款由微軟於2016年收購的Android鍵盤應用程序。最後，在9月底，繼Google Duplex領導後，微軟發佈了其語音服務工具，引入改進的文本到語音合成功能。

11月下旬又發佈了一系列有趣的公告，例如Cognitive Services Containers。認知服務允許開發人員在他們的應用程序中利用AI，而無需他們成為數據科學方面的專家，或擁有廣泛的AI相關知識。反過來，容器的故事圍繞邊緣計算的案例展開。這是一個概念，當不需要將數據發送到雲來執行計算而是在本地處理時，可以減少延遲並在許多情況下優化成本。藉助容器中的認知服務，Microsoft的客戶現在可以構建將在Edge位置運行AI的應用程序。

投資

來自CB Insights的人工智能100強創業公司

人工智能空間的投資最近一直在蓬勃發展，儘管Crunchbase合理地呼籲，但很難估計投資的規模。 CB Insights已經構建了一個很好的AI空間信息圖，並在本文中對頂級初創公司進行了分類。我們看到兩個主要的收穫 - 首先，2018年人工智能行業的最大輪次由中國公司籌集，如SenseTime和Face ++（分別為16億美元和6億美元）。其次，在今天存在的11只獨角獸中，估值為200億美元+估值，5家公司來自中國，佔總估值的50％，SenseTime以驚人的45億美元估值領先集團。這突出了一個關鍵點：與其他國家相比，中國似乎正在加快步伐。此外，由於其佔地面積越來越大，中國現在正成為人工智能領域的強國。

倫理、法規和教育

深陷假貨爭議

人工智能從 Verge上生成了奧巴馬總統演講的假片段

2017年12月，Motherboard發佈了一個關於Reddit用戶名'deepfakes'的故事，該用戶正在發佈一些色情視頻，它主要就是把一些的明星的臉映射到色情明星的臉上。雖然不是很完美，但是這些視頻看起來非常可信。很快，Reddit就禁止了這些視頻，由此，這項技術的合法性和潛在的討論也就從那時起開始升溫。

通過交換演員面孔製作假視頻背後的技術已經存在了一段時間，但創作的容易性和質量在2018年達到了一個新的水平（另見一個技術嫻熟的用戶可以在這裡實現的另一個例子））。製作假色情影片雖然令人不安，但可能相對無害，但正如我們最近看到的那樣，同樣的技術可能被用來製作假新聞或製作虛假的宣傳材料（或讓總統巴拉克奧巴馬說出他從未說過的話，至少不在公共場合），這可能會對我們的整個社會產生嚴重影響。事實是，這些深度假貨仍然存在，並且可能只會更難以與真實的東西區分開來。

AI偏見

來自微軟博客文章“面部識別：行動的時候到了

在過去幾年中，有監督和無監督的學習方法都產生了一些令人興奮的結果（DeepMind的AlphaZero是通過無監督學習可以實現的一個例子）。儘管如此，大量的實際應用程序仍然需要在標記數據上進行訓練模型（順便提一下，這是經常阻礙進一步進展的關鍵問題之一）。

但是，擁有一個標記數據的大型數據集來訓練模型與擁有一個好的數據集並不完全相同。你看，依賴於監督學習的神經網絡與它們最初訓練的數據一樣好，所以如果底層數據集有任何缺陷（例如以犧牲其他特性為代價關注一個特徵），那麼很可能是神經網絡網絡會接受這些偏見並進一步放大它們。這在理論上聽起來可能不是太糟糕，但只有我們考慮到在實際應用中產生的可能問題之後- 正如我們在2018年所看到的那樣，這些可能是非常深刻的。

例如，在M.I.T.的研究員Joy Buolamwini所做的研究中。她證明微軟、IBM和Megvii的領先人臉識別系統對1%的白人男性進行了錯誤的性別分類，在高達35％的深色皮膚女性中犯了錯誤。原因是？這些模型是在一個有偏見的數據集上進行訓練的，該數據集包含更多比例的白人男性照片，因此在正確識別他們的性別方面逐漸變得更好。考慮到人臉識別技術現在越來越多地被執法部門使用，並且非洲裔美國人被挑選出來的機會最多，因為他們在大量數據庫中的比例不成比例，這種性能差異可能會產生非常顯著的負面影響。

2018年公佈的同一問題的另一個著名例子是與亞馬遜內部人工智能招聘工具相關的案例。亞馬遜打算利用機器學習功能來實現更有效的招聘流程，並且可能完全自動化一些步驟。不幸的是，事實證明，上面提到的工具是針對以前申請過這家公司的人的簡歷進行培訓的，其中大多數是男性。結果，該模型發現了這些偏見，並反過來訓練自己降低女性候選人的等級，優先考慮“男性語言”之類的東西，以促進男性的申請應用。亞馬遜最終取消了該工具，但還有很多其他公司試圖利用人工智能來幫助招募流程，其模型可能存在類似的缺陷。

今天，越來越多的人（和公司）呼籲當局設計監管框架來管理人臉識別的使用。這會很快發生嗎？這還有待觀察，但至少會出現某種程度的監管。

優步的自動駕駛汽車在亞利桑那州致行人死亡

優步沃爾沃XC90自動駕駛汽車

不幸的是，即使是最偉大的技術也會在複雜的、不確定的環境中運行時偶爾會出錯。因此，在2018年3月18日，不幸的事情發生了，一輛屬於Uber的自動駕駛汽車在亞利桑那州坦佩撞上並最終致死了一名行人。這次事故迫使該公司暫停其無人駕駛汽車的所有測試，並重新檢查其工藝和技術;它還引發了關於自動駕駛汽車背後技術現狀以及道路和監管挑戰的熱烈討論，如果自動駕駛汽車要在短時間內獲得更廣泛的公眾認可，就需要應對道德和監管方面的挑戰。

九個月後，優步被允許在匹茲堡恢復自動駕駛汽車的測試，其次是12月份在聖弗朗西斯和多倫多，儘管在那些情況下，優步的自動駕駛汽車仍然侷限於“手動模式”（這意味著該公司將是專注於將汽車軟件暴露在新環境中，而不是積極運行測試。為了再次贏得當局的好評，優步不得不同意對允許運營自動駕駛車輛的道路類型和條件達成額外限制。此外，優步不得不改用一個系統，為駕駛員提供更嚴格的訓練。最後，該公司推出了第三方驅動程序監控系統，並對其技術進行了進一步改進。

不過，在自動駕駛汽車方面，我們似乎不太可能看到有關公共安全和必要法規的討論結束;相反，優步的不幸事故只會助長正在進行的辯論。我們將看到2019年將帶給我們什麼;然而，有一件事，我們可以肯定，未來2 - 3年可能會證明在形成關於自動駕駛汽車主題的公眾輿論方面，這是至關重要的。

對於那些對自動駕駛汽車的歷史和現狀感到好奇的人，我們建議您查看有關自駕車的自動駕駛汽車的深入指南（https://www.wired.com/story/guide-self-driving-cars/）。

麻省理工學院投入10億美元用於新的AI學院

2018年10月15日，麻省理工學院宣佈成立一所名為麻省理工學院斯蒂芬A.施瓦茨曼計算機學院的新學院，該學院是Blackstone的聯合創始人兼首席執行官。新學院將專注於解決人工智能興起所帶來的全球機遇和挑戰。

麻省理工學院已經在該領域擁有非常強大的聲譽（更不用說它在AI領域的努力可以追溯到20世紀50年代後期的領域）。儘管如此，仍然很難高估這一最新發展的重要性。例如，施瓦茨曼的禮物將允許創建額外的50個專門負責人工智能研究的教職員工，有效地使麻省理工學院的計算機和人工智能研究人員數量翻了一番。

強調跨學科合作，以及相關政策和倫理的研究，以確保人工智能被負責任地實施，這裡也是值得注意的。我們已經看到一些智庫和研究計劃在最近這幾年集中在這些主題創建方面，也得到了麻省理工學院的承諾，因為在這個問題上我們還有很多工作要做。

AI應用程序：計算攝影

來自Business Insider的Prisma應用程序生成的圖像

從最廣泛的意義上說，計算攝影是過去幾年中人工智能最可能取得最顯著進步的領域，至少從消費者的角度來看是這樣的。前幾年該領域取得了很多進展（例如Google Photos學習如何在2015年自動標記和分類照片，或者iPhone 7能夠自動模糊以縱向模式拍攝的照片中的背景），在2018年，我們看到了一些特別令人印象深刻的技術成就，從而使其成為大眾產品。

Google Pixel的夜視模式或iPhone XS和XS Max上提供的智能HDR等功能只是通過使用機器智能實現的一些功能的一些示例。這裡可能更有趣的是，這些新功能現在已經清楚地證明了AI能夠實現超出攝像機物理限制的改進能力，從而將整個領域設置在一條新的激動人心的道路上。因此，今天的計算攝影已經證明了它對那些熟悉AI領域中其他進步的人以及遠離該領域的用戶的價值。

計算攝影應用的另一個方面是當神經網絡被用於使用算法完全重寫圖像，以將輸出調整為看起來像著名藝術家的藝術品，例如梵高或莫奈（例如參見Prisma app）。類似的概念用於機器視覺的各個領域，例如，無人駕駛汽車。