機器學習-人工智能-用戶分群--聚類分析

#機器學習#

#用戶分析#@標籤設計@用戶畫像@互聯網科技@人工智能

自學B站課程筆記總結:

在風投領域,如何為客群分群呢?有些時候是有標籤的。如:客戶是否有過欺詐、非欺詐的行為。

另外一種情況,則需要通過其他類型的特徵進行判斷了,如消費記錄、還款記錄、提現記錄等。

例如,我們可以人為定義高風險客戶,低風險客戶、高消費客戶、低消費客戶。

說到聚類,就要提簇的概念,不重疊,也不覆蓋的。通過定義距離,來度量相似的程度,米尼科夫斯基距離。適合數值型的變量。


機器學習-人工智能-用戶分群--聚類分析

距離公式


機器學習-人工智能-用戶分群--聚類分析

類別性變量


機器學習-人工智能-用戶分群--聚類分析

類別性變量轉化為數值型變量


機器學習-人工智能-用戶分群--聚類分析

簇間距


機器學習-人工智能-用戶分群--聚類分析

數據預處理方法

如果有一些人的收入在100萬,相對比較少的時候,用歸一化的處理效果並不好,分母還是特別高。除此之外,新的樣本還會出現比0小,或者比1大的結果。


機器學習-人工智能-用戶分群--聚類分析

衡量聚類效果好壞


機器學習-人工智能-用戶分群--聚類分析

計算誤差或距離的方法

如果聚類模型做的好,則樣本距離簇的整體最好。貪心策略指每一步都朝著更好的方向。


機器學習-人工智能-用戶分群--聚類分析


機器學習-人工智能-用戶分群--聚類分析

先用層次聚類,選出的精度比較好。


機器學習-人工智能-用戶分群--聚類分析


機器學習-人工智能-用戶分群--聚類分析


機器學習-人工智能-用戶分群--聚類分析

假設少量樣本覆蓋了各種情況。


機器學習-人工智能-用戶分群--聚類分析


機器學習-人工智能-用戶分群--聚類分析


分享到:


相關文章: