我們總在聽說博弈論,可博弈論到底有什麼用?

逆向思維一下,也正是因為這些造物主制定的大規則,才讓我們智人能夠走到今天。

“博弈”無處不在,小到一局象棋,大到同行企業之間的競爭、國家之間的合縱連橫。對應的英文就是Game,可想而知有多常見。

十幾年來我很喜歡研究“博弈論”,今年在中歐工商學院的《管理經濟學》又系統學了一遍相關知識,最近把“得到App”精英日課的“博弈論15講”也聽了一遍,今天就為大家結合商業實務聊一聊。

我們總在聽說博弈論,可博弈論到底有什麼用?


一、單次博弈

大家最耳熟能詳的就是“囚徒困境”了。大意是,兩個合謀犯罪嫌疑人(A和B)被逮捕,警方證據只夠判輕罪,決定分別審訊:如果兩個都不認罪,都判輕罪1年;如果都認罪,都重判5年;如果A不認罪B認罪,A“抗拒從嚴”判8年,B作為汙點證人立即釋放(反之亦然)。

從總體利益上來講,“都不認罪”是最佳策略(合計判2年);可實際上,A和B都陷於“囚徒困境”—— 都不相信對方能忍受“坦白立即釋放”的誘惑,所以都只能都“認罪”,從而產生總體最壞的結果:都認罪(合計判10年)。

類似的,還有“公地悲劇”—— 在小區門口有一塊漂亮的公用草坪,每個人的最優策略都是享用草地而不付出精力保護,很快草坪變得破破爛爛,最終誰也無法享用,全都是loser。

在咱們SaaS行業裡也經常看到這樣的狀況,為了搶奪一個客戶,同行們每次遭遇戰都報低價,目的是即便我不賺錢,也不讓你拿到客戶。更麻煩的是,SaaS廠家都覺得自己的新客戶第一年不掙錢不要緊,反正還有續費。

可實際情況是,競爭激烈,為了鼓勵銷售,一次收了3年錢;

實際情況是,收到費用太低,實施和服務跟不上,客戶壓根沒用起來;

實際情況是,這客戶根本不會續費!

長期如此,廠商都不掙錢,VC的錢燒完了還見不到利潤,顯然也是一種“囚徒困境”。

那麼,如何避免這樣的“悲劇”呢?

我先講講我親身經歷的故事。十幾年前我在華為軟件“戰略與Marketing”部門時,負責一個BMT(1000多人)的軟件合作。我們運作了一段時間後發現,軟件採購與硬件採購非常不同。硬件交付的是“產品”,抽檢合格後集成到設備裡保證高概率不會出問題。而軟件公司提供的不僅僅是“產品”,還有大量實施和售後支持服務。如果價格壓地太低,華為團隊與供應商團隊一起到客戶端交付時就會有一堆問題,最終影響全局。

後來我們軟件合作部門就決定,供應商認證和議標過程中,加大從“長名單”進入“短名單”的供應商認證門檻,提高“技術”部分的影響,降低“商務”(價格)部分的影響。以此保障客戶端的交付質量。

這是什麼?這是經歷了“多次博弈”後的成熟表現。

我們總在聽說博弈論,可博弈論到底有什麼用?


二、多次重複博弈

上面的例子說明,多次重複博弈的情況下,“囚徒困境”是可以改變的。

當然我不是推薦搞什麼價格同盟,實際商業中,3方及以上的價格同盟很難形成和穩固,而且這還是有違國家反壟斷法的。

事實上,經過2、3年博弈後,競爭各方都會越來越理性,設法在產品定位上找到差異點,在營銷過程中強調差異,在定價上保障收益率。這也是新生市場與成熟市場的差別——競爭者和客戶(例如上面說的華為軟件)都會更加理性。

說回博弈論,有一個非常有趣的多輪博弈模型,它證明在大部分多輪博弈過程中,“以牙還牙”策略是最優的。

舉個例子,有100人參加一個Game,輪次無限,每一輪都是每個參賽者與另外99個參賽者逐一“博弈”。如果A遇到B,A出“合作”,B“不合作”,則A得“0分”,B得“5分”;如果雙方都合作,則各得3分;如果雙方都“不合作”,則各得1分。

我們稱一直出“合作”牌的為“傻子”;稱一直“不合作”的為“騙子“,除此之外,還有很多別的策略,例如“隨機出合作和不合作”等。其中一個被證明最有效的是“以牙還牙”策略。

“以牙還牙”策略是這樣:不管對誰,第一輪我都選擇合作;第一輪後我就複製對手上一輪的做法(他上次出“合作”,我這次也合作;他上次出“不合作”,我這次也不合作)。

據《精英日課》萬維鋼老師講,1980年代密西根大學的Robert Axelrod教授組織了一場博弈競賽。

我在網上查了更多資料:第一輪,研究博弈論的經濟學家和數學家等提交了14個程序(策略),其中包括很多複雜的策略。200輪重複博弈後,“以牙還牙”這個簡單的策略勝出。

通報結果後,第二輪他又徵集了62個策略。這次重複博弈的次數是隨機的,出乎意料的,仍然是“以牙還牙”這個非常簡潔的策略勝出了。

所以說,“以牙還牙”策略是簡單、粗暴但非常有效的策略。“簡單”這一點也非常有價值:你有一個好策略很重要,讓對方知道你在執行什麼策略也非常重要。

具體到現實世界,因為對方有可能出錯牌(或對你的善意信號發生誤解),如果雙方都是“以牙還牙”策略,則可能陷入互相報復的死循環。因此,“以牙還牙”策略還有一個變種:連續被欺騙2次,下一次開始才會“不合作”(2報還1報)。

我們總在聽說博弈論,可博弈論到底有什麼用?


三、無限重複博弈策略的後果

這樣重複博弈後,各種策略的人會得到什麼樣的結果呢?

經過經濟學家們的模擬,結果很有意思。

《自私的基因》也用大篇幅談到博弈論和Axelrod教授的“第三輪”博弈實驗。第三輪實驗的變化是,每一輪結束後,贏家不再得到分數,而是與其完全相同策略的“後代”。這樣多輪之後,有的策略逐漸數目稀少,而有的策略則數目眾多。1000代後,種群不再變化,穩定的狀態已經形成。

大家可以想象,“傻子”多的環境下,“騙子”可以活地很好;但騙子數量越來越多、傻子越來越少時,騙子就活不下去了,騙子的數量也會減少。如果這中間還有很多“以牙還牙”者,騙子就會更難。當然,如果是“2報還1報”的改進型以牙還牙,騙子還是有一些空間。

我們把策略分為兩種,“惡意”(設法通過欺騙獲得更大利益)和“善意”(希望通過合作獲得更大利益)。

總體來說,無論是通過數學邏輯推導,還是Axelrod教授的三場計算機模擬,甚至是《自私的基因》中的一些生物學實證,都可以發現,“善意”和“寬容”是更長期有效的競爭策略。這裡的“寬容”是指允許對方偶然犯錯。

這也讓人類對未來有了更多的信心。

逆向思維一下,也正是因為這些造物主制定的大規則,才讓我們智人能夠走到今天。


分享到:


相關文章: