史上最「中國」的AI學術大會!訊飛秒掉全球對手,情感識別大熱|學術進步正在引領產業變革

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

"

隨著越來越多的AI人才走入行業,我們期待有更多成熟的技術落地,推動各行各業的自動化和智能化升級。

來源:智東西(ID:zhidxcom)

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

今天(8月21日),第24屆國際模式識別大會(ICPR)在北京開幕。今年大會共收到1258篇論文,最終有125篇論文被選作口頭報告,527篇論文被選作海報展示,總體入選率達52%,屬於近幾屆ICPR較低的入選率。其中,中國有超過100家高校及研究機構的論文被接收,入選口頭報告的有60篇,入選海報展示的論文數量達300篇。

在中國企業中,阿里巴巴、京東方、平安科技各有一篇論文入選口頭報告,三星中國R&D研究院、北京麥哲科技、京東金融、眾安科技、深圳中科微光和阿里巴巴各有1篇論文作為海報展示。

誇張一點來說,我國高校和企業的入選論文佔了總入選論文的半壁江山。

情感識別專家摘得大獎桂冠

此次,我們觀看了模式識別最高榮譽King Sun Fu Prize(傅京孫獎)頒獎活動。這是一個頒給對研究人員的終身成就獎,用於鼓勵獲獎者在模式識別領域的傑出技術成就。該獎項每兩年頒發一次,提名者必須由IAPR成員提名,並至少得到五名成員的認可,且IAPR執行委員會和獎項委員會成員不具備獲獎資格。

今年的獲獎者是芬蘭奧盧大學教授Matti Pietikainen,他在局部二值模式(LBP)紋理分析、人臉圖像分析等方面做出了許多開創性的貢獻,他發表了300多篇學術論文,在谷歌學術上的引用次數總計超過5萬次。2011年,他因為在機器學習視覺紋理和人臉分析方面的貢獻而被任命為IEEE Fellow。

隨後,Matti Pietikainen發表了主題演講,分享了其研究團隊在人臉分析與情感AI方面的一系列研究成果,包括情感與動態人臉表情識別、基於局部二進制(LBP)算法的圖像和視頻描述、心率測量、可視語音識別和多模態情感分析等內容。

除了介紹相關算法外,Matti Pietikainen還展示了這些研究的一些應用場景,並分享了幾個有趣的實例視頻。比如機器可以在川普和希拉里的競選視頻中根據兩人的動態表情變化實時分析出他們在那一刻的心情。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

此外,面部表情分析還可以應用到情感機器人、顧客體驗分析、在線教育、疼痛強度預估、審訊、價格談判、心房顫動等多個行業場景。

Matti Pietikainen表示,目前情感AI領域的研究仍然處於初級階段,未來挑戰的研究方向有卷積神經網絡二值化(Binarized CNNs)、常規算法和卷積神經網絡混合等。

對於產業界而言,情緒識別還是一個非常新的領域,目前在這方面投入關注的企業不算太多,已經做出具體產品企業的包括曠視、竹間智能、微軟小冰等。

圖文識別大面積落地開花

昨天,MTWI(Multi-Type Web Images,多樣式網絡圖像)識別挑戰賽在會上舉辦,中科院、清華、北大、三星中國研究院、科大訊飛、商湯科技、網易等學術界和產業界的研究機構紛紛參與了這次比賽。

MTWI識別挑戰賽一共分為三個任務,每個任務的參賽隊伍數量分別為70、193、26支。三個任務如下:

(1)網絡圖像文本行識別(Text Line Recognition of Web Images),要求識別出給定文本行中的文字;

(2)網絡圖像文本檢測(Text Detection of Web Images),要求檢測出文本行所在位置;

(3)網絡圖像端到端文本監測和識別(End-to-End Text Detection and Recognition),要求同時對文本行進行監測和識別。

該挑戰賽使用華南理工大學和阿里巴巴聯合收集的已標註圖像作為MTWI數據集,訓練集和測試集各有10000張圖像。每支隊伍有三次機會提交測試結果,最終結果按每支隊伍的最優成績加以排名。最終,科大訊飛和中科大語音及語言國家工程實驗室聯合團隊的成績相當亮眼,在三項任務全部奪魁。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

雖說是學術會議,本屆大會依然吸引了不少企業前來參展, 在大會的展區,我們也看到科大訊飛、百度、阿里巴巴等國內企業的身影。

圖片是互聯網時代傳遞信息的重要媒介,每天都有億兆級別的圖像在流動傳播,圖片中的文字識別(OCR)有重要商用價值。除了昨日挑戰賽拿了三項冠軍的科大訊飛外,阿里巴巴和百度也各自展示了其在圖像文字識別領域的產品。

阿里巴巴“圖像和美”團隊打造的OCR雲產品,能夠實現快速高效率的圖像文字定位、識別和理解。展位工作人員現場展示了“釘釘”APP中的“傳圖識字”功能,對現場隨便拍一張照,手機可以立即識別出其中包含的文字。除了現場拍照,“傳圖識字”還提供方便的卡證照識別服務,比如它能直接識別並整理發票圖片中的內容。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

除了人臉識別,

“AI+安防”還有很多可能

在展區的另一側,有幾家主營AI+安防業務的企業展位,它們都是從中科院自動化智能感知於計算研究中心孵化。有趣的是,在人臉識別幾乎成為“AI+安防”主旋律的大背景下,這幾家公司的主攻方向都在於補上人臉識別應用於安防領域容易出現的漏洞。

人臉識別往往需要足夠高清的攝像頭和較近的拍攝距離,但當遮擋、光線等變數出現時,人臉識別往往不再適用。銀河水滴的主營業務就是補上這一缺口,他們主要做步態識別的軟硬件及解決方案,能夠通過對人進行遠距離的跨視角步態識別,其精確度高達94.1%。此外,銀河水滴還打造了全球最大容量的步態數據庫。

做虹膜識別業務的中科虹霸和中科虹星則是一對同門兄弟,他們的創始人員都源自中科院自動化所的虹膜識別研究團隊。不過,兩家公司的主攻方向卻有所不同。中科虹霸主要在做近距離虹膜識別的產品,展位工作人員向智東西展示了他們的可以存放20000人虹膜信息的身份驗證成機,用戶在距離機器大致60cm的位置錄入虹膜,隨後即可通過虹膜識別判斷身份。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

中科虹星的產品則主攻遠距離虹膜識別。其工作人員展示的身份驗證機器的用法和上述提及的中科虹霸產品相似,不同的是,它將驗證距離擴大到1.2m,並可以根據客戶的需求對驗證距離進行相應的調整。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

模式識別技術落地廣泛,

學術進步引領產業變革

近年來,AI發展非常迅速,大部分最新研究成果都會先發表在頂級會議上。作為產學研的基礎,AI學術研究的成果可能會引發未來幾年新的行業變革。

本次主辦ICPR大會,對於我國在國際AI學術領域而言,絕對是值得慶賀的進展。從主辦權到參與度,從論文數量到科研成果,我國高校、科研機構和企業正在不斷刷新記錄,我國在AI領域的影響力與日俱增。

在本次大會上,我們還看到許多高校的碩士和博士生穿梭於各報告廳之間。我們也驚喜地發現,許多研究團隊正在和企業合作,這意味著我國學術人才正在走出象牙塔。

隨著越來越多的AI人才走入行業,我們期待有更多成熟的技術落地,推動各行各業的自動化和智能化升級。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革


分享到:


相關文章: