自學B站課程筆記總結:
在風投領域,如何為客群分群呢?有些時候是有標籤的。如:客戶是否有過欺詐、非欺詐的行為。
另外一種情況,則需要通過其他類型的特徵進行判斷了,如消費記錄、還款記錄、提現記錄等。
例如,我們可以人為定義高風險客戶,低風險客戶、高消費客戶、低消費客戶。
說到聚類,就要提簇的概念,不重疊,也不覆蓋的。通過定義距離,來度量相似的程度,米尼科夫斯基距離。適合數值型的變量。
如果有一些人的收入在100萬,相對比較少的時候,用歸一化的處理效果並不好,分母還是特別高。除此之外,新的樣本還會出現比0小,或者比1大的結果。
如果聚類模型做的好,則樣本距離簇的整體最好。貪心策略指每一步都朝著更好的方向。
先用層次聚類,選出的精度比較好。
假設少量樣本覆蓋了各種情況。