人們談論的「模型」究竟是什麼?

「模型」這個詞可以說是和閉環、賦能、產業互聯網、打法、去中心化等並列近年熱門(hui bao)詞彙了。詞彙本無措,是人們用錯了地方才讓詞彙背了鍋,今天我們來聊下「模型」這個詞的意思、使用現狀和錯誤示範~

人们谈论的「模型」究竟是什么?

01 什麼是模型 (Model)

按照wiki的定義,模型是指對於某個實際問題或客觀事物、規律進行抽象後的一種形式化表達方式

這裡要劃的重點是:抽象!模型是可以簡化人們的認知成本,有助於人們撥開龐雜細節和迷霧,理解客觀事物的。

比如說我們看這個胖橘貓,可以每個愛擼貓的盆友都覺得自家的橘貓天下最美、獨一無二,但是在一個對貓無感的人眼中,橘貓的各種特點就集合為兩個詞:橘色、胖,於是如果讓這個人畫一個橘貓(「建模」), TA有可能畫了一個類似加菲貓的喵~ (這就引出後面會說的話題,引入不完全或者錯誤的特徵變量會導致模型的解釋度不高)。

人们谈论的「模型」究竟是什么?

模型這個詞英文叫model, 和中文中模特也是一個意思,其實很好理解,再回想模型的定義——對於某個實際問題或客觀事物、規律進行抽象後的一種形式化表達方式

模特的身材大概率符合傳統美學,可以很好的展示衣物的特質,是不是就可以對客觀事物(衣服)可以進行抽象化表達了,人們的注意力可以放在衣服上(解釋為什麼很多模特走秀時不笑)。

我覺得一個好模特應該是可以為不同風格品牌走秀的,比如我很喜歡的大表姐劉雯,可以走大牌秀,本土的品牌例如Dazzle、鄂爾多斯、運動品牌Puma也駕馭的很好。

人们谈论的「模型」究竟是什么?
人们谈论的「模型」究竟是什么?

左dazzle 右維密

02 模型和建模聽起來高深啊,是不是我八輩子都學不會啊!

不,你會!而且從小學開始解一元一次方程就會!

曾經我也以為建模很難,但其實我們都接觸過,建模這個概念不難理解,但是如何用模型來解釋、預測客觀世界的複雜難題就另說了。

建模就是建立數學模型(modeling) 簡單理解呢就是小學應用題列方程/公式的過程,把客觀抽象為符號表述。

我們看下面計算基礎代謝率的例子,基礎代謝率可以簡化理解成如下:

人们谈论的「模型」究竟是什么?

y=ax1+bx2+cx3+d 的函數

其中:y是要計算的基礎代謝率,是因變量(dependent variable)

x1、x2、x3是自變量(independent variable/argument),分別代表 體重、身高、年齡

a、b、c是係數(parameter)a=9.6說明體重每漲一公斤,基礎代謝率上升9.6

d是常數項

在我研究生上的統計建模課上,我們組最後的final project作用應用了課上學的因子、聚類、決策樹模型和邏輯迴歸模型,選題是預測休克概率。

我記得因變量有各種血壓、血糖等醫學指標,分析和後面的presentation做的還滿好的,得到了老師的郵件表揚。

剛剛講到了建模、參數、因變量、自變量等基本概念,現在講講什麼才是一個好的模型呢?

我們本文的技術顧問小斐如是說:

理解好問題,找到合適的方法,有些固定的場景 比如推薦,那就主要是算法裡面的問題,要最優和計算效率,還有數據 一定要有充分的數據 才能做好模型!數據決定模型的上限,算法決定模型的下限。

我們來理解一下,除了數據,其實我覺得建模也是很需要想象力和敏感度的,比如去做假設,基礎代謝率是不是還跟其他變量有關:頭髮長短、手指長度、眼睛大小等等(別懷疑,我在一本正經的胡說八道,舉個例子)所以模型也是要不斷迭代跟進才能更好的擬合已有數據(訓練數據)和做預測的~

為什麼數據建模師會戲稱自己會調參俠呢

因為模型需要迭代,通過訓練數據調整模型參數,使模型對於數據的擬合程度提高~

通過這個案例,可以看出模型的作用有:

  • 抽象簡化:有一些現實中的過程,比較複雜,難以理解或預測。我們設法對其做一些簡化,抽象成一個數學能夠處理的模型,比如基礎代謝率的計算。
  • 描述/預測:抽象成模型後,處理這個模型可以進行預測,或者對已有的現象提出機理上的解釋。模型會幫助解釋一個系統,研究不同組成部分的影響,以及對行為做出預測。

好模型不一定很複雜,根據奧卡姆剃刀原理,相同解釋度的情況下,選擇越簡單的模型越好。

03 是不是隻有數學模型啊?怎麼老闆讓我做各種看不懂的英文字母的模型分析啊!!

不得不說模型這個詞有被濫用的趨勢,不是整幾個英文單詞,弄個縮寫就可以叫做模型的,Sxxx Bxxx 不能叫SB模型,SB最多是個縮寫。

但是在社會科學中,確實有商業分析模型、認知模型和思維模型等等,迴歸定義,建模的本質在於抽象,即將你關注的事物的特點提取出來,構造出一個想象中的事物去解釋或者預測客觀事物,這個事物也就稱作模型

以行業模型分析為例,框架可以簡單理解為模型的集合。

人们谈论的「模型」究竟是什么?

我覺得模型的使用不能僵化,否側就會造成你有把錘子看什麼都是釘子的感覺,還是要從問題出發,靈活應用方法模型的,如果你能直接問到某個公司的研發收入,何必再用各種財務模型等來推算呢?

我覺得模型/框架最大的作用就是可以不重不漏的來收集信息,對行業各個屬性進行描點了,做好了這一步最多完成60分,後續的連線建立聯繫、畫面總結共性才是真正考驗功力的。

人们谈论的「模型」究竟是什么?

04 模型的活學活用

今天下午朋友組局我玩了人生第二場德州撲克,真是個好玩的遊戲,雖然我最後輸的精光還和”銀行”貸款,但是“花錢”買到的教訓還蠻多~德州的輸贏可以簡化為以下的函數

f (手中的牌、已經翻的牌、還沒翻的牌、對手的牌性、對手的牌、bluffing吹噓的能力,別人對你吹噓的信任度、座位位置…..)

每一局的影響因素都不一樣,這就是德州吸引我的地方。

免責說明:雖然我研究生學的是統計專業,但是我半路出家、學藝不精、荒廢多年。

題圖來自Unsplash,基於CC0協議


分享到:


相關文章: