AI以數據開始,但絕不會以數據結束

我記得有一位教授說:“AI就是他們所說的機器智能,他們還沒有完全理解。一旦他們理解了它,它就不再被認為是人工智能。一旦很好地理解了機器人技術,它就不再是人工智能而成為了自己的分支機構。一旦理解了計算機視覺,它就變得獨立了。語音識別和自然語言處理也沿用了這條路線。“或許,唯一能夠很好地理解並且人工智能如此重要的領域,分離會使AI變得毫無意義,是機器學習,使用複雜的數學重算法進行插值的科學潛在的功能。正是由於這種特殊的地位,我們有時會出現“AI和機器學習”這樣的口號,這有點像說“數學和微積分”。

AI以數據開始,但絕不會以數據結束

機器學習(包括稱為“深度學習”的更著名的分支)當然是至關重要的。 ML算法在許多AI領域都很常見,它們是非常深奧的關鍵,它可以幫助機器從一些模糊的輸入中猜出所需的結果。將數據集加載到模型中即可 - 您可以獲得預測。 ML使這種情況發生。媒體得到消息。如果您現在閱讀最受歡迎的文章,您可能只會相信AI會神奇地解決所有問題。總體配方對於故障是平庸的 - 收集數據集,找到可以插入問題複雜性的ML算法,訓練模型並收集現金。簡單。然而,正如任何真正的AI實踐者都知道的那樣,ML雖然至關重要,但並不是問題的核心。谷歌ML研究人員的一篇開創性的NIPS論文深入解釋說,機器學習只是人工智能應用的一個微不足道的部分。大部分工作圍繞優化管道,收集乾淨數據和提取適合ML模型的特徵,並且可在動態環境中維護。這在自然語言理解中尤為突出,為了提取適合分類器模型的特徵,需要解決拼寫錯誤,詞幹,停用詞,消除實體引用的歧義,可能,查看上下文,瞭解人們經常使用化妝單詞,準備好慢慢改變詞彙和主題分佈,以及無數其他的東西。

有人可能會問,為什麼不完全跳過這個並將任務加載到一個強大的深度學習框中?當然,我們可以交換數據建模的複雜性,以便在培訓階段花費更多時間?好吧,祝你好運。你有沒有嘗試過預測樹木年輪的天氣?它們是相關的......你的機器應該能夠找到從一個到另一個的路徑。問題是,在發生這種情況的時候,你可能會在地下安靜地休息。一些最強大的超級計算機用來預測更具影響力的信號的天氣仍然會做出不準確的預測。有一個原因 - 計算的指數複雜性不是開玩笑。許多輸入特徵對最終結果具有不同程度的影響,並且大多數甚至不相互獨立 - 這一屬性與ML算法設計中的普遍假設截然相反。

這就是領域專業知識變得無價之寶的地方。簡而言之,人類專家可以通過提供機器的快捷方式來修剪大量不必要的計算。這是通過使用多年來在特定領域中積累的知識人類專家建模推理路徑來完成的。繼續NLU,一個很好的例子是利用來自語言學的信息來豐富數據,例如詞性,句子結構(即解析樹),拼寫法等。要了解這些好處,請考慮如何有效地管理複雜項目。你要做的第一件事是分解並建立中間裡程碑。它們的範圍更小,更容易定義,因此更容易到達。然後,實現更大的整體將減少到達每個中間裡程碑,這更容易定義和跟蹤。與NLU相同 - 建立中間步驟有助於在將中間體結合在一起方面重新定義問題。但是建模比採取捷徑還要多。培訓數據集的支持者忽視了過多的領域,在這些領域中甚至很難定義如何編譯數據集以進行培訓。這意味著人們很難向註釋器(用預期結果標記數據集的那個)解釋如何為每個數據樣本提出預期結果的邏輯。有時,標籤的含糊不清使事情複雜化。其他時候,分析輸入數據的複雜性 - 向人類提供所需的感官數據可能是完全不可能的。在物理世界中,某些測量可能對註釋器是危險的(例如,如果您的輸入是氣體)。這些情況中的每一種都立即使得從一開始就收集數據的整個過程變得不可行。如果您無法生成輸入數據,您對ML模型的選擇無關緊要!這樣做的好處是很多。首先,您不再需要嚴重依賴手動數據收集,正如我們所討論的那樣,這種數據收集充滿了約束和錯誤。這樣可以更全面地覆蓋您的域。想想你更喜歡的東西,2個數字相乘的規則,還是列出不同可達數字對的產品的無限表?其次,您可以向最終用戶解釋推斷。

AI以數據開始,但絕不會以數據結束

您可以解釋這是一個具有真實英文名稱的特定域名功能,而不是突出顯示您的反向傳播在第7個隱藏層上的影響。第三,它允許更清潔的產品組裝和更優化實施的更換部件的能力。嘗試使用ML管道! (這是值得再次閱讀上述NIPS論文的地方)

那麼,你可能會問什麼?到目前為止,您可能同意域建模對於有效實施至關重要。您決定聘請領域專家並繼續。還有更多嗎?是!因為域建模對於AI應用程序來說是如此重要,所以它也可以作為尋找新的未開發AI應用程序的指南針!換句話說,為了找到新的機會,尋找一個難以收集數據的領域,同時一般領域環境得到充分理解,而且缺乏自動化。正是在這些空間中,人們可以通過一個簡單的ML橋接關閉兩個領域知識集群之間的小間隙,並突然得到更令人印象深刻的結果。並且,與“我們將所有內容與所有人群相關聯”不同,您將擁有完整的域名覆蓋,更好的描述能力以及最終更強大的產品的優勢。


分享到:


相關文章: