映客AI有多強?已構建性別年齡等數百個推薦維度

9月19日,2018年雲棲大會在杭州開幕。上千位頂級學者、行業專家,來自64個國家的CEO和CTO齊聚雲棲小鎮,共同探討互聯網科技的前沿發展及未來趨勢。

在【友盟+】承辦的數據智能實踐專場中,映客直播內容推薦高級總監陳雪峰發表了題為《如何通過AI來做直播個性化推薦》的演講,對映客直播的推薦體系和AI技術應用做了詳細介紹。

映客AI有多強?已構建性別年齡等數百個推薦維度


一直以來,映客作為直播領域的頭部平臺,不斷以技術先驅引領業內創新。陳雪峰表示,映客作為全新的流量分發平臺,在誕生之初便具備算法應用的前提條件。通過收集大量數據,進而推動算法模型的優化,經過多版本迭代,目前已覆蓋平臺內十幾個核心場景。

映客AI有多強?已構建性別年齡等數百個推薦維度


映客“五層塔”系統:為精準推薦保駕護航

陳雪峰介紹,映客推薦系統分為五個層次,從下到上依次為數據層、離線算法層、在線算法層、策略層和服務層。

映客AI有多強?已構建性別年齡等數百個推薦維度


在映客平臺,每天會產生海量的用戶行為。而“五層塔”系統的任務就是對這些行為背後的數據進行採集,並加以整理、提煉,同時不斷糾錯、優化升級,最後推薦出最有可能被用戶喜愛的內容。以離線算法層為例,它對用戶數據採用分類、聚類、迴歸、預測等多個模型,精準刻畫用戶畫像,目前已經構造了包括性別、年齡、地域等幾百個維度在內的畫像體系。

此外,陳雪峰還表示,“五層塔”系統也會考慮曝光頻率控制、流量保護等策略,做出最優決策。

專門搭建圖像識別平臺 解決三大核心挑戰

對於個性化推薦在直播產品中的應用,陳雪峰提到三個核心問題:第一是對直播內容的理解——從科研角度來看,直播間完全是一個黑盒,很難判斷直播間裡發生的是什麼,這大大增加了系統做內容推介的難度。第二點是實時性,也就是內容變化的隨機性。主播是沒有劇本的,完全取決於跟用戶的交互,而映客要實時響應這種變化。第三是精準性,也是衡量所有推薦系統的標準。

針對以上難題,映客通過圖像識別、語音識別、文本挖掘來進行內容理解,還專門搭建了圖像識別平臺,深度學習與統計學習雙管齊下,提高推薦預測的準確性。

映客AI有多強?已構建性別年齡等數百個推薦維度


直播間內容理解 用戶畫像很關鍵

陳雪峰表示,對於直播間來說,用戶畫像對於推薦作用是最核心的。映客通過圖像識別技術預估主播畫像,比如人臉屬性識別,甚至會識別眼睛大小,包括主播服飾等等。怎麼抽取和設計標籤呢?採用以下兩種方式,第一對主播群體進行聚類,對聚類結果抽取標籤,第二是基於業務知識抽取標籤。雖然很多標籤標準是感官判斷,但對人群還是有區分性。映客還對場景和行為進行識別,目前覆蓋了上百種行為標籤,如鋼琴,彈古箏,健身等。為實現上述目標,映客搭建的圖像識別平臺起到很大作用。

如何獲得大量的標準數據,提升深度學習效果?陳雪峰介紹,映客通過構造兩個閉環獲取標註數據。所有直播間都有人工審核的過程,審核時會給直播間打上標籤,用於模型訓練,把新的數據模型預測結果再推到人工標註平臺,人工再對預測結果進行修整,通過迭代循環不斷提升模型效果。另外是通過收集到的行為日誌,基於行為日誌預測標籤進行訓練,同時根據分發後的反饋數據修正標籤,從而不斷優化模型。

智能推薦效果顯著 用戶觀看時長增三倍

陳雪峰表示,在AI技術的幫助下,映客直播的整體效率有了顯著提升。個性化推薦與人工運營相比,點擊率增加50%,用戶觀看時長增加三倍,關注轉化率也整整翻了一倍。在今後,映客會在直播間內容理解方面投入更多精力,包括在推薦中如何做好短期內容和長期內容的探索。

映客AI有多強?已構建性別年齡等數百個推薦維度


在未來的人類生活中,AI技術註定會發揮越來越大的作用。在這次雲棲大會上,映客分享了自己對於AI技術的研究成果,也展示了繼續深入探索並獲取更大成就的決心。AI與映客,一個是技術界的寵兒,一個是泛娛樂直播的領軍者,二者在將來還會碰撞出怎樣的火花?

讓我們拭目以待。


分享到:


相關文章: