營銷的數之智與智之能


營銷的數之智與智之能

TalkingData首席機器學習科學家 李想

TalkingData首席機器學習科學家李想,在智勝營銷峰會暨 Best Audience Buying 頒獎盛典”上發表了主題為《智勝營銷--暢談數之智與智之能》的演講。旨在從數據科學的角度闡述到底何為“智勝營銷”,又如何從數據中提取智能,以及如何將智能作為能力賦予給客戶。希望通過本次分享能夠使營銷人,對“智勝營銷”理解的更加透徹,並把分享所學應用於營銷實踐中。現在一起回顧下,TalkingData首席機器學習科學家李想給現場嘉賓帶來了哪些前沿觀點和營銷乾貨。

TalkingData收集/處理的各類數據

在TalkingData的數據架構中,最底層是數據的採集層, 移動端、互聯網數據和各類合作伙伴,都是我們採集數據的渠道。數據採集進來後,數據團隊開始對這些原始數據進行各類加工處理,如判斷設備以及設備所對應的屬性等。包括設備對應人的年齡、性別及其他基本屬性。在此之上,我們會提供設備中的APP行為、互聯網行為,以及各類線下消費購物行為等,這些都是比較基本的原始數據。

在原始數據之後,我們著重介紹一下原始標籤。其中包括標準標籤,可以理解為TalkingData定義的自有標籤系統。但很多時候我們發現有一些TalkingData標準標籤系統無法滿足客戶的定製化需求, 所以我們又提供了UGC標籤的能力,使客戶可自己定義標籤體系。模型的探索/部署,還有我們這裡開發的基於合規/保護隱私的Embedding數據輸出,是我們數據體系的另外兩個熱點。


營銷的數之智與智之能

標籤2.0:人工智能標籤

TalkingData每天會處理大量的數據,僅自己內部產生的數據,每天數據量就已經約32T。這大概是什麼概念呢?如果看4K高清電影,32T等同於700部的4K高清電影。這麼多數據,它有什麼價值?我們就以營銷特定的場景跟大家分享一下怎樣從豐富的數據中,產生與從前不一樣的價值。

最近國家人口政策從計劃生育到鼓勵二胎,與這個場景相關的,我們可以看到客戶對育兒類的標籤需求相比以前變了很多。其中一個很有特點的就是母嬰類人群的標籤。首先說一下母嬰標籤的定義,即家裡有從出生到三四歲小寶寶的人群,都可以被打上母嬰標籤。和標籤相關的,我們打標籤的方法也從過去的人工產生標籤(標籤1.0)演進到了基於人工智能的標籤方法(標籤2.0)標籤1.0是如何定義的?首先,找到所有女性的設備,之後找到特定母嬰人群的APP。然後,用這些App和“女性”屬性做交集,就產生了第一版本的母嬰人群。

從今年開始,TalkingData內部對數據的加工方式已經從過去的人工向人工智能轉化, 標籤製作的方法也從人工的1.0升級到了人工智能的2.0。標籤2.0又是如何製作的?首先,還要找到一些的女性設備和一批大致能夠反應是母嬰人群的App。但差別在於,過去需要儘可能找到所有覆蓋母嬰的App,而現在只需找二到三個典型與場景相關的App就可以了,這些被我們稱作為種子標籤人群。有了種子標籤人群,我們會通過各類人工智能的算法把他們和所有設備大庫裡的設備進行基於各類特徵的分析。比如基於App, 位置, 購物,機型,等等,找到設備大庫裡其它和種子標籤人群類似的設備,並把他們和種子標籤合併,生成更多的母嬰標籤人群。


營銷的數之智與智之能

在瞭解瞭如何在數據中提取智能之後,這樣的智能還能用來做些什麼呢?主要是三個點,分別是Know who、Know when、Know what。

Know who

即為整個業務中的主體,也就是人。TalkingData最關心的就是幫客戶找到對他們最有價值的用戶群。人有手機、郵件、平板、電腦、電視等等相關設備。如何把人的信息完整地

刻劃出來,從而提供人的價值,而不是碎片的設備價值,也是在TalkingData持續關注的內容之一。


營銷的數之智與智之能

Know when

是比時間更加寬廣的概念,可以叫場景。對用戶場景有了解,根據場景做相應的觸達。具體包括了三方面:行為、位置、姿態。

營銷的數之智與智之能

Know what

有了人和場景之後,我們的最終目的是希望通過行動來改變用戶的價值,這就相當於what。知道用戶的價值以及喜好、畫像之後,結合所在的場景,比如是在地鐵、辦公室或者是家裡面,才能採取更加適合的行動。


分享到:


相關文章: