數據理論時代

數據理論時代

隨著大數據理論的廣泛應用及AI算法的深入研究,對於數字信息的收集、處理和應用的能力,已經成為了劃分朝陽企業和夕陽企業的唯一標準。這裡說的是“企業”,而非“行業”或者“產業”。因為在產業互聯網時代,任何野蠻人都不再具備跨界顛覆整個產業的能力,轉而謀求合作與賦能。只有對數字信息理解更透徹,更重視的企業,才能在產業互聯網時代找到風口,不管你的產業有多麼“傳統”。


數字化的價值

  • 兩件使用價值完全不同的物品孰貴孰賤,很難判斷。於是引入了金錢,即一般等價物,將完全不同的使用價值進行了同等的量化。
  • 同理,判斷兩個國家實力的強弱,最重要的考察指標即是GDP,其次還有人類發展指數(HDI)等等。
  • 判斷學生學習好壞,考察指標自然是學生的學科成績。

數字化的第一個價值即在於將不同事物引入統一的量化標準,於是人們對不同事物的高低貴賤有了判斷的依據。

就好像三國遊戲中武將的能力各異,但將其抽象量化為武力、智力等指標後,即使關公戰秦瓊,玩家也有了評判孰強孰弱的標準,儘管這個標準有大量的主觀因素。

人類天生就喜歡比較,但比較只是手段,真正的目的是樹立一個優化的榜樣或目標。數字化的第二個價值即在於指明進步的方向。就好像永遠在你媽媽口中的“別人家的孩子”,你媽媽並不是只想告訴你別人家孩子的成績比你強這個事實,而是期望你能在下次考試時能獲得一個優秀的成績,可以讓她也能在親戚朋友面前得意洋洋一番。

數字化的本質是給個性的事物安裝了一個共性的數據接口,只有標準化的數據信息才能更方便的加工、處理及優化,這也是數字化的第三個價值。

數據理論時代

數字化的合理性

數字化是對客觀事物的抽象反應。客觀事物是豐富多樣的,幾個簡單的數字化指標並不能反應事物的全部,但指標過多同樣會影響判斷。比如購買電子產品時,普通消費者是無法針對產品參數逐一比較的,專業一些的消費者可能會參考性價比或跑分,大多數消費者可能憑藉口碑傳播。

數字化指標少則不能反映事物的關鍵特徵,多則會影響判斷並失去價值。而現實中,更多的問題是由後者導致。

雷軍七字訣被很多商業人士奉為圭臬,其中一條即為“極致”,極致的前提就是數字化指標不要過多,如果某企業KPI動輒數十上百項,其結果就是沒有任何一項能做到極致。

數字化既要合理的反應現實,又不能太多,那麼數字化體系的制定即是標準或者理論建立者的智慧體現。有價值的數字化體系,要經過合理的“奈奎斯特抽樣”,使得數字化指標對客觀事物的反應,既不失真,又不冗餘。

  • 比如2007年,在追逐GDP的背景下,時任的遼寧省委書記推出了通過耗電量、鐵路貨運量和貸款發放量三個指標分析經濟狀況的量化體系,被稱為“克強指數”,該體系得到了眾多國際機構的認可。
  • 20世紀60年代,美國營銷學學者傑羅姆·麥卡錫教授提出營銷學4P理論,隨著市場的不斷演進,1990年美國營銷專家勞特朋教授在4P的基礎上提出4C營銷理論,將驅動導向由企業轉移到消費者。
  • 在筆者看來,判斷初創企業成功率的三個指標:項目、團隊、資本;判斷團隊管理質量的三個指標:士氣、效率、能力。(這兩個為筆者淺見,另文詳述)

等等……

真正有價值、對現實有指導意義併產生影響的,不是海量實例,而是從實例中經過“奈奎斯特抽樣”抽象出來的數字化理論體系。

模型的建立

明顯的數字信息很容易理解,比如考試成績,通話記錄,購物記錄,GDP等等,這些都很容易記錄。但某人的性格特徵、興趣愛好,資質潛力、或者某團隊價值,能力高低,品牌競爭力等,這些連本人或團隊自身都無法準確評估,又如何產生數字化效果呢?

這就需要建立數學模型,並提供一個合理的算法。

  • 比如:克強指數=工業用電量增速×40% + 中長期貸款餘額增速×35% + 鐵路貨運量增速×25%,公式中的三個指標都很容易進行統計,而權重比例是根據三者增速與GDP增速擬合模型的一個簡單的迴歸分析結果,該數值更能體現經濟發展水平,擠掉GDP水分。
  • 再如品牌指數模型,包括品牌競爭力模型,品牌成長模型、品牌影響力模型等,共分10個大類,100多個變量。
  • 2012年初,淘寶推出了淘寶指數,包括人群指數、價格指數、熱銷指數等10個維度,幫助用戶瞭解淘寶購物趨勢。

一切信息都可以通過建立合理的模型或規則,轉化為數字,從而進行加工處理或指導人們進行比較和優化,關鍵還是看模型是否能夠不失真且不冗餘的反應客觀事物。

數據理論時代

數據處理

上文提及:信息數據化的第三個也是最重要的價值是方便計算和處理。

舍恩伯格在《大數據時代》中闡述過兩個觀點:

  • 數據量越全面豐富,計算或預測結果就越接近真實值。
  • 在大數據時代,相關性比因果性更重要。

但面對海量數據總要有一個美妙的算法模型才能挖掘客觀真相,做出有效預測啊,而且面對各種品類的數據,如何兩兩組合尋找相關性呢?就好像超市的商品成千上萬,如何恰好找到了啤酒和尿布的相關關係呢?總不能所有商品都排列組合一遍吧。

其實這個美妙的算法並不高深莫測,就是現在如日中天的機器學習等AI算法。只需要把用戶行為(如購買的商品)視為一個向量,通過多層深度神經網絡,以海量的數據進行訓練,就可以產生一個無限接近真實情況的模型。至於神經元中的參數,我們不需要知道因果,我們只要知道,導入用戶向量,可以得到分類的結果就可以了。

就好像克強指數的權重為什麼是40%,35%,25%呢?我們不需要知道,這個因果關係的研究留給社會學家或者經濟學家,我們只要知道這個權重比例能夠更有效的擬合GDP增長就可以了。

和學術研究相反,數據處理時少問幾個“為什麼”可能更好。

當然,實際應用中的數據處理和挖掘,遠比上面描述的要複雜,需要經過不斷地建模、優化和擬合的過程。同時,不是每個企業都具備阿里巴巴那樣的EB級的數據處理能力和龐大專業的工程師團隊,但是,至少要具備儲備人才、能力和運用AI提高效率的意識,否則龐大的數據不會成為金礦,反而變成負擔

數據理論時代

數據驅動

產品驅動類型有很多,競品驅動、技術驅動、市場驅動等等,但這些在如火如荼的AI時代都已顯得過時。

在經過數據收集、量化、建模、處理之後,如果只是作為PPT上的報表數據,而沒有得到有效利用去驅動產品,那與買櫝還珠無異,因為沒有用到上文提到的數字化的第二個價值:指明方向。

數據驅動日益成為新的產品驅動模型。從用戶、銷售或業務前臺收集來的信息,或多或少都會摻雜主觀判斷或情緒,但是數據不會,因為數據的處理是建立在客觀模型基礎上的,它可以比用戶更瞭解自己,比銷售更瞭解市場。

看起來有些像數字迷信,但數字理論時代的產品經理必須善於捕捉微小的數字變化,而不能單憑主觀臆斷。寧可迷信數字,也不要迷信自己。

同樣,企業的基礎IT部門也不應再視為產品下游的支撐部門,而更應該將自己定位為數據驅動中心

回到文章開頭所述,只有有效利用數字信息,合理抽象數字理論,才能在產業互聯網時代迎來朝陽

數據理論時代

文|高見遠,轉載請註明出處。


分享到:


相關文章: