NLP的未來——語義落地(semantic Grounding)

目前基於深度學習的NLP技術已經在翻譯、分類等任務上有了卓越的表現。然而在不斷調參、窮舉模型、增加數據的背後,是否能有另一條路可以讓我們讓機器獲得真正理解語言的能力。飛馬網於5月31日晚,邀請到法狗狗法律人工智能技術總監龐雨穠老師為大家分享該領域的內容。

以下是這次分享的實錄:

NLP的未來——語義落地(semantic Grounding)

今天直播的主題NLP的未來——語義落地,關於語義落地四個字,我會在後面的部分詳細的介紹。

一、如何製造一臺理解人類語言的機器

NLP的未來——語義落地(semantic Grounding)

第一個部分主要是探討我們到底如何能夠製造一臺理解人類語言的機器,在機器學習和人工智能大熱的今天,許多問題,如人臉識別、醫療診斷等都可以通過深度學習來得到很好的優化,同時在自然語言的處理,深度學習的出現也讓原本無法處理的任務達到了一個很高的水準,比如說我們現在使用的深度學習對詐騙短信的識別,就是說比如把一個詐騙短信放到機器模型裡面去識別到底這個是不是詐騙短信,這個準確性已經突破了95%,這個已經高於人類對詐騙短信的識別能力。

那我們是否能說機器對語言產生了理解呢?

NLP的未來——語義落地(semantic Grounding)

不只是說我們主要是探討一個問題,機器是否真正有一天能夠去理解自然語言,我今天更多從一個認知科學的角度來分析這個問題,所以在討論這個問題之前,我們可以先內省一下自己,我們是如何理解和學習自己母語的,“大漠孤煙直,長河落日圓”,這麼簡單的一句話,一句詩描繪了一片蒼茫的大漠晚霞的場景,引起了人們對於社會、國家、民族的無限遐想,所以我們問,語言到底是什麼,為什麼這麼簡短的一句話卻能表達這麼多內容。許多動物和生物都會使用自己的身體語言,包括行為、聲音、光來向第三方來表達自己的認知,一頭狼在發現獵物的時候就會採用嚎叫的方式來呼叫自己的同伴,而一條狗在看到主人歸來的時候,就會歡快的搖擺尾巴表達內心的興奮,螞蟻和蜜蜂也有一套精密的溝通方式,來獲得食物的所在地,一些近似於人類的動物,比如說青猴,也會使用類似的方式來提醒有老鷹還是有獅子來襲擊。這些都動物似乎都在一定程度上擁有自己的交流能力,但是人類的語言有別於動物的,因為人類的語言能夠更高效、靈活、精確的表達認知,人類的語言能夠自由的組合,精確的描述某一種狀態,比如說門前的大橋的橋洞下面有十隻鴨子,這個表示的是一群鴨子游過門前橋洞的一種場景,像這種描述場景的能力,在其他動物身上是很難具備的。所以在討論機器是否能夠真正理解人類的語言之前,先討論世上是否存在人類之外的另一種生物來理解人類的語言。

NLP的未來——語義落地(semantic Grounding)

NLP的未來——語義落地(semantic Grounding)

如果有人去過羅馬,就會知道在羅馬廣場有一座著名的雕像,描述的是一個傳說,就是有兩個孿生兄弟被他們殘暴的國王叔叔下令讓僕人將他們扔到河裡殺死,而僕人把他們掛到河邊的樹上就跑掉了,在這個過程中被一隻母狼救下了,這隻母狼用它們的奶餵養長大,最後這兩兄弟被一個牧人發現帶回了家,最後成長之後復仇並建立了自己的國家,而這就是羅馬這個城市的來由。其實這兩兄弟是非常幸運,在和狼群生活之後,仍然能迴歸人類文明並且能夠習得人類語言,這其實是非常困難的一件事情,但實際上並非是所有的狼孩像這兩兄弟幸運,許多被發現的狼孩在很小的時候和狼一起生活之後,在長大之後就無法習得人類的語言,也沒辦法在習慣人類的社會,比如說有一個著名的在美國的兒童,叫做吉米,而這個吉米在出生的第二個月就被父親囚禁起來,與世隔絕,而這個吉米在十三歲的時候被人就出來,重新學習英語,但是至今仍未完全掌握。這說明了即使擁有完全一樣的生理條件,但是後天的額學習和不能及時的學習,都會導致人類再也沒有辦法學會人類的語言,所以我們人類的基因裡面只有學習語言的能力,但是並不會包含任何具體語言的內容,所以每個人生下來其實是一樣的,都需要重新去學習語言,但反過來思考,只要我們具備合適的條件和恰當的學習,那麼是不是任何一個生命體都有理解語言的可能呢?

NLP的未來——語義落地(semantic Grounding)

作為人類最好的朋友,狗一隻是以具有靈性著稱,特別是那些從小就和主人一起長大的小狗,尤其聰明伶俐,對於主人的指令和動作都能理解的非常到位,但這是不是真實的呢?這種理解到底是不是真實的,這種懷疑的的產生是因為心理學上有一匹著名的馬,叫做漢斯,這匹馬能夠通過訓練後計算十以內的加減法,但是在後面的研究中發現,漢斯其實並不會真正的算術,而是主人通過一些暗示讓它知道答案。但其實狗是很聰明的動物,而且有別於其他動物。有一條狗叫做Rico,這其實也是一條很著名的狗,這條狗可以懂得兩百多個單詞的名字,包括顏色、形狀這種詞彙,而且實驗表明,Rico真正能聽懂這些單詞,並且能夠通過這些已經學會的單詞來去推測並且學習其他新的單詞。Rico有一個非常厲害的地方,就是Rico雖然不知道一個詞什麼意思,但是能通過推測來獲知詞的意思,比如說把一個黃色的球和一個紅色的球放在一起,然後對Rico說把黃色的球拿過來,雖然它不知道黃色的球是什麼意思,但是知道紅色的是什麼意思,那麼它就會推斷出剩下的球是黃色的,所以Rico可以實現語義的推斷,並且準確的把黃色的球叼出來。為什麼說狗有別於其他動物呢,這是因為狗在很早以前就已經開始被人類馴化,在馴化過程中,它們的生活環境,飲食都與人類有非常相近的地方,而且小狗在很小的時候就已經跟人進行交互,所以狗的認知體系在很大程度上與人有重合。在這種情況下,狗做出的行為很容易被人理解,而人的行為也容易被狗所理解,所以狗的語言學習能力,在眾多的動物中,是一種獨特的存在。所以狗的例子就說明了如果要理解人類的語言,不僅僅需要強大的腦子,你不能只在森林裡奔跑,你需要去融入到人類的社會里面去,與人類有直接的、強烈的交互,最後才能產生和人類一樣的認知能力,最後才能理解人類的語言。

NLP的未來——語義落地(semantic Grounding)

不知道有沒有人看過這部電影,叫做《降臨》,這部電影講的是一群外星人來到地球,想給地球人送來一份禮物,但是卻無法溝通,在溝通的過程中把禮物表達成了武器,這種情況下與人類產生很大誤會,差點毀掉人類的未來。外星人有沒有可能理解人類語言呢,在物理條件極端不同的情況下,兩個物種間產生的語言差別是很大的,所以,就像電影描述的,外星人使用的語言,是一種陌知的語言,這種語言跟人類的象形文字是有很大區別的,但是我覺得外星人卻是一種很有可能理解人類語言的個體,因為在他們的腦海中,已經對物理有了一個基本的認知。假如大家對這個物理事件有一個認知體系的話,我們只需要將這兩個認知體系劃上一個等號,就有可能實現一個溝通。這也表明,我們在溝通的情況下,要儘量的抓住一些共識,比如說我們和外星人溝通的時候,我們就應該抓住一些宇宙間的共識,比如說宇宙中的這些生命都需要能量,而生命都需要生存,我們抓住這些共識和特點之後,就可以進行溝通和交流,這就像來自不同地區的人類,想要互相理解對方的話也應該從對方的認知體系進行入手,所以我們要跟一個人聊天的時候,儘可能從雙方共識地方入手。比如說要跟一個四川人聊天的時候,就會聊到火鍋、辣椒這些事情。

說了這麼多,那麼我們的計算機能不能理解人類的語言呢?

NLP的未來——語義落地(semantic Grounding)

在我們討論計算機之前,可以在聊一下到底什麼是理解。

NLP的未來——語義落地(semantic Grounding)

說到理解,可能每個人都有自己的認識,但是對於腦科學來說,理解是兩個或兩個以上的人對同一個事物產生共識,比如說有一張上面是小貓的照片,一個人認為它是小貓,另一人也認為它是小貓,那麼就可以說兩個人都理解這張照片的內容。如果從大腦的FMI圖上來看,假設兩個人都能理解一個東西的話,意味著在腦中激活的活躍區域是相似的,比如說這張圖片裡面,兩人同時看到了同一個物體。人類的共識可以通過腦部的這個FMI圖來進行比較,但是假如我們與其他生物,或者與計算機,怎麼去判斷,不同的生物之間是不是產生了理解,或者說是產生了共識。

NLP的未來——語義落地(semantic Grounding)

比如說上圖裡面,人看到這隻籃球之後,會產生一個腦部的激活圖像,而狗也會產生一個圖像,但是這兩個激活的區域到底意味著什麼,我們很難知道。比如說我們使用的電腦的這個深度學習技術,將籃球的圖像變成一個向量,這個向量可能有n個維度,這些維度到底意味著什麼,是不是和人一樣都能認識到這隻籃球是可以彈跳、可以被拍打的一隻球體。其實我們很難去驗證這些激活的圖像和這些向量是不是具有相等的等同性。

NLP的未來——語義落地(semantic Grounding)

所以在這種情況下,我們很難從系統的內部狀態來判斷這兩個系統是否產生了共識,也就是說是否產生了理解。這種情況下我們只能通過外部的手段,通過觀察外部的表現來判斷系統是不是產生了理解。比如說我們之前瞭解的圖靈測試,就是說一臺電腦是不是產生智能,怎麼去判斷這個事情?並不是判斷某一塊芯片是不是產生了電流,這是看不到的,我們應該使用一個外部的測試,找n個測試者,這些測試者坐在一起,跟電腦聊天。假如這些測試者都沒辦法判斷出這個電腦是不是人的情況下,我們就可以說,這個電腦具有人類的智能。假如我們很難從一個系統內部來判斷一個系統是不是產生了真正理解,那我們只能通過外部的現象來判斷,有一篇發表的文章,就是使用了認知科學的方法來探究神經網絡的黑箱。首先它使用了三類圖像,第一種圖像叫做顏色匹配;第二種圖像叫做形狀匹配;第三類圖像叫做探測物圖像。這篇文章的主要目的使用一個叫探偵圖像的東西來探測神經網絡或是深度學習這個網絡它們用哪些特徵去是被識別一個物體的,最後得出的結論是深度神經網絡更傾向於使用形狀的方式來識別物體。所以來說還是存在一種外部的方法來探測系統內部是不是真正產生了理解。

NLP的未來——語義落地(semantic Grounding)

所以說了這麼多,到底什麼是語義落地呢?

NLP的未來——語義落地(semantic Grounding)

所謂的落地,就是講語義映射到真實的場景當中。比如說有一個例子,我把綠色的木塊放到棕色的木塊上面,然後我再把黃色的木塊放在紅色木塊上面,那麼什麼木塊在黃色的木塊下面。對於這種問題,自然語言處理系統是很難去解答的,因為我們目前的機器很那建立一個像物理空間一樣的世界去進行推理和解答,所以我們要將語義落實到真正的事件裡面,來產生一個理解和推理。

二、語義落地方法論

NLP的未來——語義落地(semantic Grounding)

接下里介紹一些語義落地的方法論,主要三個方面。一個是純人工的方法論,一個是機器與人交互產生理解,最後是如何用機器來完全的產生理解和落地。

NLP的未來——語義落地(semantic Grounding)

使用人工的方法來實現語義落地,其實很簡單。我們要用人工的方法來賦予語言知識,然後通過機器的方法來做一個映射,這種情況下,機器並不需要去真正構建一個知識體系,而是由人去把這個知識體系去構建起來。最後機器只需要相對應的情況映射到知識體系就可以了。

NLP的未來——語義落地(semantic Grounding)

比較出名的一個就是Wordnet,這個網絡主要是將詞語的一些解釋彙總起來,但這種情況下並不能很好的解決問題。

NLP的未來——語義落地(semantic Grounding)

Hownet也叫知網,假如有研究自然語言處理的同學應該知道,知網其實一個知識網絡,在這個網絡裡,分為三個部分,動詞、名詞、形容詞,比如說形容詞就是會建立起一個樹形的結構,在這個樹形的結構裡,它會將每一個詞不斷分解,如“人”,可以分解成很多層意思,人可以是一個動物、生命、物質、實體,可以不斷將一個名詞的概念做分解,他們提出一個方案叫義元,每一個詞語分解成一些yiyuan,所有的詞語由yiyuan構成。所以在這個知網體系中,就可以映射到人類已知的維度上面。

NLP的未來——語義落地(semantic Grounding)

包括動詞,一樣可以被落地成動詞模型,如“架子”,分解成一個包括主謂賓的動詞結構模

詞模型裡面。所以人工建構的知識體系,映射到人類已經知道的維度空間裡面去。這種維度空間,即可以用計算機處理,也可以用機器去處理,這種情況下我們可以做一個人工的語義落地。

NLP的未來——語義落地(semantic Grounding)

這種語義落地其實是一種比較好的方案,比如說削蘋果的皮和削蘋果的刀,他們之間只差一個字,但是是兩個完全不同的句子,前一句中削是一個動詞,而後一句表達的是一個名詞。假如使用知網的這個分析器的話,我們可以知道這兩句話存在很大的差異,相似度非常低;但是假如使用百度的深度神經網絡的解析器,他們只相差一個字,被分析出來的結果也是一樣的,相似的可能性就非常大,達到86%,這是不對的。但是我們可以發現,削蘋果的皮和蘋果之間存在從屬關係,皮是蘋果的一部分,但是這個刀並不是,這一方面的知識必須是由人工去賦予,在這種情況下,我們說深度學習不能解決這類問題,是因為不存在這方面的信息和數據讓他們去推理。像剛才這個例子,我們可以看到,我們可以用人工的方式,去構建這種落地體系,剛才的例子裡面人工已經賦予了意思,我們只要將這些詞語映射到人工已經定義好的維度上面,然後我們就可以對這些詞語進行推理和分析。

NLP的未來——語義落地(semantic Grounding)

那麼人和機器之間存不存在一種交互的可能,通過這種交互的方式產生共識和理解呢?在斯坦福大學的這篇論文裡面,他們設計了一種遊戲,這個遊戲就是在機器完全不知道紅色方塊/藍色人方塊/棕色方塊的前提下,我們可以通過交互的方式,比如你告訴它將棕色的方塊放在橘黃色的方塊上面,這種情況下,假如它做對了,你就告訴它做對了,它會通過這種交互的方式,慢慢學會理解什麼是紅色的方塊,什麼是放在下面或者旁邊,它會慢慢理解這些概念。而這種情況下,人類並沒有初始的定義這些紅色、棕色或者這種顏色,包括多少個這種數量的名詞,而是通過人類與機器的交互的過程中,機器慢慢的習得這些定義,所以這種方式可以稱之為人機交互的落地方法。

NLP的未來——語義落地(semantic Grounding)

那麼機器有沒有可能自己通過學習來認識環境中的情況,並形成自己的體系?同樣有一個實驗,建立了一個虛擬的環境,在這個環境裡,作者構建了一個神經網絡,用於識別語言,在這個環境裡面,有一個問問題的機器人,稱為Q,另一個回答問題的稱為A,這個A能看到各種形狀各種顏色的物體,Q什麼也看不見,那麼Q只能通過問A問題,然後A回答Q到底看到了什麼。

NLP的未來——語義落地(semantic Grounding)

可以看到實驗最後,計算機兩個神經網絡在交互過程中,產生了自己的語言,他們具有一定的組合性,比如說它沒有看到過紅色的三角形,但是看到過黃的三角形,得到三角形這麼一個形狀的表述。這就是說機器人在神經網絡的學習中,慢慢習得人類語言的可組合性,所以我們可以看到機器可以通過深度學習和強化學習的方法,慢慢形成一套他們自己的語言,並且具有人類語言的特性。而這個過程完全不需要人類的參與,稱為機器落地。

NLP的未來——語義落地(semantic Grounding)

所以以上介紹了一些如何使用機器將一些現實中的語義符號映射到現實中的一些方法。這個過程就像是兩個原始人還未產生語言,一個掉到坑裡,但是他們之間沒有產生語言,只能通過咿呀來告訴外面的的人他想吃東西,外面的人就會根據這個意思給他水果,比如蘋果,猛烈搖頭表示不是,這種情況下,再扔一個香蕉,如果對了的話就會食用,在交互過程中,就產生了對物品的理解,也就是說這兩個原始人之間產生了新的語言。

三、未來

NLP的未來——語義落地(semantic Grounding)

從上面這些說明可以看到,不管是人類還是機器,我們在學習語言都是一個不斷嘗試,雙方共同進化的過程。所以語言存在的意義是交流。其實可以發現,機器人能夠理解紅色黃色方塊的概念,但是對於我們人類社會存在的一些概念還是非常難以理解的。比如說什麼家庭,什麼是拉肚子,什麼是思考。這種很難去構建虛擬世界,並且讓機器人去這個虛擬世界中去學習。那麼如果想讓機器人去學習這個世界,必須給機器提供一個完整的沒有差別的虛擬世界,並且讓機器人像人類一樣去交互,只有交互才有可能讓機器去理解到底什麼是人類的社會。我們也需要在機器的虛擬世界中構建一個物理世界,比如說什麼是上面下面,什麼是速度時間,因為假如沒有這些概念,就有很多問題就都沒辦法找到答案。

最後介紹一下對於法律領域的這些問題。法律領域額文本其實概念都是非常大的,什麼是社會,什麼是國家,什麼是人類,什麼是犯罪,很難再虛擬的計算機世界去構建。我們採用的是半人工的落地方式,將一些法律法規變成一些可以推理的符號邏輯。用戶在問了一些關於法律問題的情況下,我們就可以對用戶問的這些概念進行操作,通過操作就可以產生初步的推理,而這種推理很多時候,很那用深度學習活無監督學習的學習方法來學習到,所以目前只能用半人工的方式來進行語義落地。只有通過人類對物理世界和人類社會進行不斷建模,才能可能真正的將機器變成能夠理解人類的東西。

這三大部分就是今天的內容講說。下面我們一起來看看在最後的答疑過程中,都有哪些問題呢?

1、老師能否介紹一下如何進行語料的收集與加工?

龐老師:如果你是學生的話,最好的方法就是藉助學校和老師、實驗室的力量去獲得數據。每個公司,都會有一些公開和私有的數據,這些數據可以幫助到你進行研究,這就是為什麼很多大牛都會選擇進入公司的原因。公司的內部數據會完全開放給你做研究。這是其他地方得不到的。

2、老師,我是NLP方向的學生,想諮詢一下有什麼發SCI的好方法?

龐老師:有了數據以後,你只要定好主題。發論文並不是什麼難事,發好的論文最好能在一個研究路徑上面,持續地做研究,但我覺得,深度學習方向的文章太多了,你可以往這種認知科學的角度看一看。像上面那篇文章就是ACL Best Paper。

以上就是本次線上直播的主要內容,相信你對語義落地有了一定的瞭解。想要知道更多詳細內容的小夥伴們,可以關注服務號:FMI飛馬網,點擊菜單欄飛馬直播,即可進行學習。


分享到:


相關文章: