爲了更懂人類,人工智慧正在修煉的三大技術

人工智能自1956年Dartmouth學會上提出,在經歷一個又一個寒冬之後,如今真正登上了人類舞臺。當下,不論是計算機視覺、自然語言處理還是安全監控以及智能駕駛,人工智能技術的應用都近在咫尺,但那些一直期盼它能像人類一樣具備思維的夙願,至今卻仍未實現,為了更懂人類,全球人工智能科學家都在衝擊技術高點,不遺餘力的為AI技術帶來全新突破,這其中就包括近年來被認為會顛覆人工智能格局的三大技術。

對抗性神經網絡

為了更懂人類,人工智能正在修煉的三大技術

對抗性神經網絡(Generative Adversarial Network,GAN)最早出現在2014年在蒙特利爾大學博士生Ian Goodfellow的學術論證中,他採用兩個神經網絡,支持大多數現代機器學習的人腦簡化數學模型,讓他們在數字遊戲中彼此對抗。

在這個過程中就會出現兩個神經網絡的角色,一個是生成網絡(Generator),另一個是判別網絡(Discriminator),前者負責不斷生成內容,後者負責不斷判別生成的內容,彼此互博,最終在長期對抗中提升各自的能力。經過長時間的互博結果,一個不斷“造假”,一個不斷“驗真”,生成網絡的“造假”能力劇增,產出的逼真內容已經讓判別網絡無法辨識。

對抗性神經網絡的關鍵性突破就在於,通過這種對抗機制,機器開始理解人類所看到和聽到的世界結構,並最終賦予機器在創造一個全新的東西時所需要想象力,生成的結果非常逼真。

目前,對抗性神經網絡有兩種應用,一是完全從無到有的生成逼真度極高的語音或者圖像;另一個則是利用對抗性神經網絡來改進已有傳統的AI應用,例如超分辨率、照片自動美化、機器翻譯等,包括Google Brain、DeepMind、Nvidia、Open AI都是這項技術的重要參與者。

生物特徵識別

為了更懂人類,人工智能正在修煉的三大技術

所謂生物識別技術就是,通過計算機與光學、聲學、生物傳感器和生物統計學原理等高科技手段密切結合,利用人體固有的生理特性,如指紋、指靜脈、掌靜脈、臉象、虹膜等,以及行為特徵,如筆跡、聲音、步態等,來進行個人身份的鑑定。

由於人體特徵具有人體所固有的不可複製的唯一性,通常屬於私密安全範疇,這一生物密鑰無法複製,偷竊或者遺忘,因而利用生物識別技術進行身份認定,具有非常高的安全性和準確性,而目前一些常見的口令往往都不免存在著被複制及被盜用的不利因素,因此採用生物特徵作為識別的“鑰匙”,能夠大幅度提升識別效果以及降低安全風險。

未來,伴隨著生物特徵識別技術的不斷成熟,也將迎來全新的市場變化和需求,儘管單一的生物識別技術各有優劣,在安全要求較高的場景,仍舊存在提升空間,但目前而言,生物特徵識別技術的應用正在各行業擴展開來,尤其在物聯網的應用上會成為著力點,在配合安全、監控、管理系統整合,實現自動化管理上,市場前景廣闊。

情感計算

為了更懂人類,人工智能正在修煉的三大技術

情感計算的概念是在1997 年由麻省理工學院(Massachusetts Institute of Tech-nology,MIT)媒體實驗室 Rosalind Picard 教授提出的,她的著作《Affective Computing》開創了計算機科學和人工智能學科中的新分支——“情感計算”,她指出情感計算與情感相關,是源於情感或能夠對情感施加影響的計算。

由於人類交流中80%的信息都是情感性的內容,而人工智能系統只有在對人類情感得到充分了解之後,才能發揮具備智力因素的情感反饋,實現真正的強人工智能。因而,情感計算就是要賦予機器類似於人一樣的觀察、理解和生成各種情感特徵的能力,最終使讓機器像人一樣正確感知環境、理解用戶情感和意圖,以作出自然、親切和生動的交互。這種技術手段的出發點是通過心理學、生理學、認知學、行為學和腦科學等相關的綜合學科,來進行機器的情感化操作,在此基礎上,人類需求分析、情感表達、人機交互才能成為可能。

因而,傳統的人機交互應用在情感計算的不斷成熟中正在被逐漸迭代,通過語音情感識別、人臉表情識別和生理信號情感識別等,進行喜、怒、憂、思、悲、恐、驚七種基本情感計算,完成情感反饋,進而在情感語音合成、面部表情合成和肢體語言合成上具備精準結果。情感計算未來在醫療健康、安全駕駛、遠程教育、智能家電等領域都具備超前的應用前景,賦予機器擬人化的工作狀態,修煉“讀心術”。儘管如此,目前情感計算領域存在的挑戰還很多,包括情感獲取與建模、情感識別與理解、情感表達等,亟待全球頂尖人工智能科學家帶來最新突破。

在AlphaGo獲勝的那一刻,我們都不願承認歷經億萬年所進化的人類智慧被機器超越,但事實上,我們又希望冷冰冰的機器能憑藉人工智能成為更懂人類的那個夥伴,我們期待的不僅僅是讓機器“更智能”,還是“更像人”,當人工智能技術能夠解決這些障礙時,他才能支撐起自己思維的物質世界。不論是微軟小冰通過情緒特徵感知而不斷升級的共感模型、Facebook研究人員試圖通過觀看視頻來教AI來理解現實、曠視科技正在從各個角度攻破視覺識別領域障礙、還是極鏈科技Video++通過千萬次訓練來讓AI理解視頻內容所表達的不同情感等,都能看到人工智能研究者正在卯足勁向前,儘管我們要承認機器學習中的技能轉移也許不總是有效,但正是這種與現實的差距,才能不斷激勵技術進步,未來仍舊可期。


分享到:


相關文章: