我在做畢設
現在許多平臺都使用大數據的推薦算法來向用戶推薦更適合的內容,那麼這個算法本身真的很厲害麼?
A 推薦算法的核心——分類器
一個平臺上的內容何止千萬,如何才能準確地找到你喜歡的那幾條呢?
- 把用戶分類
通過你的點贊/轉發/停留/評論/不喜歡這此操作,為你打上標籤,把你分類到某一類別的用戶中。
關鍵點在於如何設計這些用戶操作和記錄的“機制”,讓用戶做最少的動作就能獲得最有效的信息,準確地把你分類到一個集中。
- 把內容分類
對每個視頻/文章/問答/圖片打上標籤,這時會用到AI的一些算法,去準確地識別內容並分類。
B 推薦算法的難點
- 數據量
這裡並不是說數據量越大越好,其實數據量過多也是算法的難處之一,涉及到如何存儲/如何處理/如何解析等等,能很好地處理龐大的數據的算法是非常不容易的。
- 計算能力
手機上的軟件就那麼大,手機計算能力就那麼點,信息處理的能力非常有限,大部分計算是網站後臺服務器實現的,可是如何能夠利用每一臺手機這些小小地處理器,將部分信息進行預處理,也是很厲害的。
- 自淨化能力
如果單純是喜歡看什麼,就讓什麼火,那後果是非常嚴重的,如果那樣,網絡上恐怕會充斥著黃色/暴力/低俗這些內容了。
所以推薦機制有一個很重要的能力,準確地識別的這些內容,並把它最快速度扼殺掉。
總結一下
大數據的推薦算法還真的是挺厲害的,想要做一個非常好的推薦機制,需要考慮的維度非常之多,需要處理的數據量非常之大,需要計算能力非常之強。
科技千里眼
當然,馬上要厲害到遠超你的想象。不過這些技術實際應用估計還要五年以上的時間。
Victor19901028
當然,信不信如果阿里巴巴的數據庫讓我管理,我能知道你穿什麼顏色的內褲,哪怕你沒有在淘寶上買過內褲!
我認識150020683
現在的大數據是互通的,你的資料在大數據裡是透明的,每個平臺都知道一清二楚