人臉識別並非自人工智能概念誕生之時就有了——那是很久之後。
1936年5月計算機科學之父艾倫·麥席森·圖靈向倫敦權威的數學雜誌投了一篇論文,題為《論數字計算在決斷難題中的應用》。在論文的附錄裡他描述了一種可以輔助數學研究的機器,後來被人稱為“圖靈機”,是為計算機思想的啟迪。
1950年,圖靈再次發表了論文《計算機器與智能》(Computing Machinery and Intelligence),第一次談到人工智能,這為後來的人工智能科學提供了開創性的構思。
同樣在1950年,圖靈發表了著名論文《機器能思考嗎?》,這篇劃時代的論文,也使得圖靈被譽為“人工智能之父”。
此後在1956年,約翰·麥卡錫在達特茅斯(Dartmouth)學院正式提出“人工智能”概念。
如果說圖靈提出的圖靈機、人工智能概念開啟了人類對機器具備智慧的夢想,那麼約翰·麥卡錫在達特茅斯(Dartmouth)學院提出的人工智能概念,使得人類確立了人工智能的研究目標,自此人工智能正式成為計算機科學中一門獨立的經驗科學。
這也使得約翰·麥卡錫同樣被認為人工智能之父。
但此時人臉識別還遠未誕生,因為此時的計算機仍然是晶體管計算機,是個龐然大物,幾乎沒多大用處。
然而,隨著科技的發展,尤其是計算機技術的發展,科學家們對於人工智能的熱情一路高漲。
1957年,康奈爾大學教授Frank Rosenblatt提出“感知器”的概念,並通過算法定義出了世界上第一個神經網絡,從此人工智能的發展有了清晰的方向。
這是第一起,人工智能的崛起,也是以神經網絡為代表的首次崛起。
而作為人工智能算法的人工神經網絡,到底該如何來進行驗證其有效性,也成了人工智能發展的一大問題。
但隨之而來的另外一個問題,使得以神經網絡為基礎的人工智能發展進入了低潮期,這個問題就是人工神經網絡需要耗費巨大的計算資源,而這對於當時還不怎麼先進的計算機技術來說,不具備可實踐性。
之後的幾十年(一直到2006年)以神經網絡為基礎的人工智能一直處於低潮期。
這是第一落,以神經網絡為代表的首度沒落,但人工智能的發展並未沒落,只是換了個方式而已。
而這另一個方式就是:支持向量機(SVM)。貝爾實驗室的Vladmir Vapnik就是其中的代表人物。
如果說人工神經網絡是模擬人腦的整個過程,那麼支持向量機(SVM)就是在走捷徑,更注重結果,支持向量機(SVM)就有點像在考試時,直接抄答案,它的效果來的更快更直接。
在那個計算機速度還不是很先進的年代,SVM,作為一種人工智能分類算法,九十年代初開始,在圖像和語音識別上,找到了廣泛的用途。
這是第二起,圖像識別的首次崛起,也是支持向量機技術的崛起。
至此開始,人臉識別的祖先——圖像識別開始廣泛地作為人工智能算法的試驗場,不斷的得到改進。
1998年,以SVM為技術的手寫郵政編碼的識別能力上,錯誤率降到低於 0.8%。
值得一提的是,雖然以神經網絡為基礎的人工智能處於低潮期,但該領域的代表人物Yann Lecun,在1989年提出的“反向傳播算法在手寫郵政編碼上的應用”,並用美國郵政系統提供的上萬個手寫數字樣本訓練這個神經網絡系統,最終錯誤率只有5%。
自此之後,無論哪個派別,圖像識別幾乎是所有人工智能算法的試金石,每年,都有相關代表參與到人工智能圖像識別算法的競賽中來。
而這其中最為有代表性的就是ImageNet大賽。
2009年, 一群在普林斯頓大學計算機系的華人學者發表了論文 "ImageNet: A large scale hierarchical image database), 宣佈建立了第一個超大型圖像數據庫,供計算機視覺研究者使用。
這個數據庫建立之初,包含了三百二十萬個圖像。它的目的,是要把英文裡的八萬個名詞,每個詞收集五百到一千個高清圖片,存放到數據庫裡.最終達到五千萬以上的圖像。
2010 年,以 ImageNet 為基礎的大型圖像識別競賽,ImageNet Large Scale Visual Recognition Challenge 2010 (ILSVRC2010) 第一次舉辦。
2010年競賽的第一名, 是NEC 和伊利諾伊大學香檳分校的聯合團隊,用支持向量機 (SVM) 的技術,識別分類的錯誤率為28%。
2011年競賽的冠軍,用所謂 Fisher Vector 的計算方法(和支持向量機技術類似),將錯誤率降到了 25.7%。
2012年,Hinton教授和他的兩個研究生首次將深度學習((本質即計算機神經網絡))的最新技術用到ImageNet競賽,錯誤率一下子就降低到 15.3%,震驚了業界。
自此以後,以計算機神經網絡為基礎的圖像識別算法,總是保持領先,且進步飛快,而支持向量機的圖像識別算法,開始逐漸沒落。
這是第三起,以神經網絡為代表的再度崛起;也是第二落,以SVM為代表的沒落。
2013年的ImageNet大賽,冠軍是來自紐約大學的Matt Zeiler,其圖像識別的top-5錯誤率,降到了11.5%。
2014年的冠軍是稱為InceptionNet的計算機神經網絡,其top-5錯誤率為6.7%,這個神經網絡有22層;
到了2015年,由微軟研究院的Kaiming He等4名華人提出的ResNet(Residual Neural Network),通過使用Residual Unit成功訓練152層深度的神經網絡,在ILSVRC 2015比賽中獲得了冠軍,取得3.57%的top-5錯誤率,同時參數量卻比VGGNet低,效果非常突出。
可以說2015年前後是一個轉折點,因為2015年ImageNet的競賽結果顯示,人工智能圖像識別的錯誤率低於5%。
而這儼然已超越了人眼的誤識率,人工智能圖像識別領域的重頭戲——人臉識別已經準備好了。
可以說,伴隨著以神經網絡為代表和以SVM為代表的人工智能發展的起起落落,圖像識別終於迎來了它的春天,但人臉識別的橫空出世,如果沒有這位“貴人”的相助,恐怕現在還待在實驗室裡。
這個貴人會是誰呢?
且看下回分解:貴人相助
閱讀更多 聞西說科技 的文章