歐洲盃沒了,"世界盃"來了,阿里引領人工智能升級2.0時代

3月17日,因為疫情影響歐足聯決定將2020年歐洲盃推遲到明年夏天舉行,今年的歐洲盃沒了。歐洲盃沒有了,"世界盃"來了,當然這不是指足球世界盃,而是在大數據行業有"世界盃"之稱的KDD CUP。舉辦世界盃是對一個國家足球綜合實力的認可,舉辦KDD CUP則是對承辦的科技公司在大數據領域實力的認可,今年的KDD CUP賽事的主辦權花落阿里,這是繼2017年之後阿里巴巴第二次舉辦該賽事。想低調,實力不允許呀。

歐洲盃沒了,

歐洲盃沒了,

KDD CUP在行業內舉足輕重的地位使得它的賽題經常是行業內關注的焦點,在某種程度上KDD CUP的賽題也被看作是行業的發展方向。今年阿里巴巴為參賽團隊準備了兩大賽題,都是產業應用密切相關的賽題:

· 賽題一:多模態商品推薦

· 賽題二、Fairness of Exposure 消除人工智能偏見——曝光偏差


等等,這個大賽不是數據挖掘行業的嗎?跟人工智能怎麼又掛上鉤了?其實人工智能跟數據是分不開的。我們都知道谷歌的AlphaGo下圍棋很厲害,這是因為它學習了大量的棋譜,數據挖掘就是從這些棋譜中找出更有學習價值的棋譜,更有價值的棋譜會讓人工智能更聰明,反過來人工智能也能幫忙從大量的棋譜中找出更有價值的棋譜。所以說數據挖掘彼此之間相互影響和完善,密不可分。


歐洲盃沒了,

明白了這點我們再來看看阿里出的題是不是引領行業的發展,本次比賽的一大賽題是"電商場景的多模態商品推薦",該賽題要求選手針對給定的文本召回最相關的商品圖片和商品視頻。阿里巴巴提供了豐富的商品標題文本、商品圖片和商品視頻的數據集,規模達到300萬以上,可供參賽選手訓練模型。其中該數據集中每條數據包含配對的商品標題和商品圖片/視頻。


這個題很有趣,以前我們購物看的圖文,後來有了視頻,現在直播帶貨又火的一塌糊塗,如果我們想買一個商品,搜索檢索文字已經比較成熟了,但是能檢索到相應的圖片和視頻嗎?這是一個很大的挑戰,而且越來越重要,對於整個互聯網行業都是如此。現實中視頻作者往往這是起一個簡單的標題,很多都沒有描述,因此視頻檢索也將成為一項重要的技術基於多模態的召回作為多模態學習的子任務,是可以給各個領域帶來幫助的,不僅僅是電商領域。


對於視頻的檢索是多模態的,需要理解視頻內容在說什麼,這本質上是從感知智能到認知智能的飛躍。感知智能和認知智能又是什麼鬼?目前我們的人工智能主要是機器學習和深度學習,學習的結果就是在"聽、說、看"等感知智能領域進步神速超越了人類,比如說可以識別出更多的物體,可以翻譯一大段話等。但是對於更高一層的智能就無能為力了,比如說人工智能機器人可以識別一個人說的話,甚至可以翻譯和應答,但是無法根據這些對話來判斷這個人是不是說謊了,有沒有說的前後矛盾等。現在的人工智能就是這樣,它只是能夠簡單的識別和感知,並沒有真正的理解和運用,而且侷限性很強。對於初級的識別、感知的人工智能我們可以稱之為人工智能1.0或者說是這是感知智能,想要更加智能就不能只是簡單識別感知而是要具備邏輯推理,具備"思考和反饋"的能力,這種人工智能我們稱之為人工智能2.0或者說認知智能。


要想實現從感知智能到認知智能的突破,需要從認知心理學、腦科學及人類社會歷史中汲取靈感,並結合跨領域知識圖譜、因果推理、持續學習等技術,建立穩定獲取和表達知識的有效機制,讓知識能夠被機器理解和運用。


2020年初,阿里巴巴達摩院發佈了十大年度科技趨勢預測,其中第一個預測的趨勢就是"人工智能從感知智能向認知智能演進"。可以見得,不僅是大勢所趨,也是高人遠見。


歐洲盃沒了,


第二個題目是消除人工智能偏見,我們的日常生活中有很多的偏見和歧視,比如性別歧視、地域歧視、種族歧視等,人工智能也有這些歧視?現在的人工智能主要是指機器學習/深度學習,需要大量的數據進行訓練,如果訓練的數據中有很多的偏見那很可能訓練出的結果也有偏見和歧視,這也是許多技術專家和倫理學家擔心的。如何消除人工智能的偏見呢?這就需要深入的數據挖掘了,利用因果推斷中Inverse Propensity Score Weighting的方法,對訓練樣本進行加權,使得不同商品對於不同用戶的曝光趨近於均勻,模擬出在隨機展示的情況下,用戶對於商品的行為,使得下游算法可以基於相對無偏的樣本進行學習。也可以進行賽馬機制,快速從無曝光商品或者視頻中挑選有潛力的內容曝光。


阿里出的這兩道KDD CUP考題,不僅僅是對人工智能發展道路的前瞻也是在實際的解決問題推動人工智能的發展。四年一次的世界盃是全球最高水平的足球賽事,參賽者都是各大洲的頂尖球隊,KDD CUP則是數據挖掘領域最有影響力、最高水平的國際賽事,吸引全世界數據挖掘界的頂尖專家、學者、工程師、學生等前來參賽,是在競爭也是在給出給自的解決方案。


人類的認知往往是基於多模態的數據的,如果解決了這個問題,解決了視頻的檢索問題,首先我們可以更容易的在阿里巴巴這樣的商品平臺上找到我們想要的商品,找到一個視頻中的大明星用的是哪部手機等,更加的方便生活。當人工智能完成從感知智能向認知智能的演進之後,人工智能就具備了一些邏輯推理能力,可以判斷我們說的話是不是前後矛盾了,可以召回具有適當多模態內容的商品並對商品進行排名幫助消費者做出更好的決策等。不僅如此,在保險、金融風險評估等領域也有重大意義,比如AI系統可以基於個人的履歷、行為習慣、健康程度以及其親友、同事、同學之間的來往數據和相互評價做出更加有意義的信用評估和推斷。有了認知能力的人工智能甚至可以跟人類一起協同工作,而且不帶偏見。


KDD CUP是全球最有影響力的大賽,阿里巴巴給它出了兩道最有意義的題目等著全世界的高手來解答,就看到時候會有如何漂亮的答案了。

歐洲盃沒了,


分享到:


相關文章: