「書評」博弈論

“博弈論”作為一種通識類話題,被編著成書的版本非常多,其中不乏很多領域的專學大家,教育學,心理學,哲學領域的名仕更是普遍廣泛,今天我要詳細介紹的是由翟文明編著,由中國華僑出版社出版的博弈論,翟文明畢業於武漢大學法學系,北京大學光華管理學院MBA,任職於大成律師事務所,擔任多家企業法律顧問,在公司治理,重組整改等方面頗為擅長,在久歷人情世故,深諳世間百態後對於人人之間的交往有了很深的見解,深挖其中的博弈思想,並將此整理成書。本書2018年1月發行首版,其後兩年內共經歷了共5次印刷,由於本書講述方式平實簡單,深受廣大讀者喜歡。


「書評」博弈論


在本書當中,翟先生以通俗易懂的方式講解了博弈論中常見的11種博弈思想,並在講述每種思想後用具體實例故事加以解讀。然而美中不足的是此11種理論只是平鋪直敘了基本原理,並沒有從宏觀上將其分類整理,書的結構顯得有些凌亂。另外博弈本身是思維碰撞的產物,不在結局揭曉的時候永遠無法確認哪種方式會更好,凡事方法都有其優缺點,也許我們千挑萬選出來的“好方法”,對於別人或是別的場景都不是最優的方式,因此我將用分類的方法將書中的思想歸類,用博弈的思維講述“博弈論”。

博弈的概念最早出現在棋局當中,主要描述的是參與雙方,根據棋盤中已有態勢,構思出預定的棋招並設計陷阱,以達到“吃”掉更多對手棋子殺死對方“王"的目的。後來人們發現在日常生活中,商業中等都存在類似的博弈較量,因此後人開始將視野轉移到抽象研究此理論,並致力於套在現實生活中。其實所謂博弈,必須要包含幾個要素,首先是要有博弈的參與者且至少有兩方對壘;其次要有一定的信息,如棋局中的棋子局勢,制定策略時,信息是必不可少的;再者必須要有一定的策略,謀定而後動才是智者的表現;最後必須存在的是利益,從博弈的最初目標中即可看出,雙方都是為了殺死對方的“王”而進行的各種策略規劃,失去了目標利益的博弈是沒有意義的。

統覽本書,我將本書中博弈的思想分為三種:博弈原型——正博弈——偏博弈,本篇文章我也會按照此分類逐一展開講解。在正式介紹博弈論前還要簡單介紹一個非常重要的理論——亞當·斯密理論。亞當·斯密是西方著名經濟學家,他認為當每個人做對自己最有利的決策時,對整個社會也是最有利的。此理論曾歷經許久深深被人們信服,更是一度被看成權威理論,從沒有人懷疑過其準確性。

直到納什的出現,才對亞當·斯密的理論產生了首次挑戰,而此次挑戰也推開了博弈世界的大門,博弈的思想開始被人們廣為流程和探討。納什在數學界中堪稱天才,在少年時期就以出眾的天分收到老師們的喜愛,到了大學的年紀,他曾被哈佛,普林斯頓等名校同時錄取,在校期間就發表過對博弈的重要理論,因此才有足夠的魄力和能力對亞當·斯密的理論發出挑戰。

下面將介紹本書中”博弈原型“分類下的第一種博弈理論——“納什平衡”,納什認為每個人都做利於自己的決策時,不一定能使效果最優,可能會產生相互衝突的影響,甚至如果決策收益完全相反時,還會產生最差效果。納什不虧是個精明的數學家,博弈的利益像極了數學中向量的計算,眾所周知,兩個向量只有按相同方向相加時才會得到最大的長度,其餘情況都會有所損益,最糟糕的情況就是南轅北轍,效果最差。因此納什給出了一個顛覆性的結論,他認為:只有當不同決策達到一個均衡點時才會使收益最大。

由此引出了一個著名的“囚徒困境”理論,此理論是博弈精髓的濃縮版,充分展示了博弈的實際本質。大體故事是,兩名共同犯罪的囚徒被分別關押,當一名囚徒出賣另一名時,即會得到一些好處,另一名會得到一些損益。如果都不出賣彼此,他們的收益將會最大,都可以無罪釋放。如果都出賣彼此,將都會受到嚴厲懲罰。按照理想情況下,兩人可以互不出賣,都可全身而退。但是結果發生了出賣行為,導致他們都收到了懲罰。以上故事就是博弈中常見的抽象模型,故事中存在兩個“納什均衡”——都出賣和都不出賣,都出賣和都不出賣對於兩個囚徒來說可得到的收益是相同的,要麼都極好要麼都極壞,此時雖然是決策均衡,但二人無法在不溝通的情況下信任彼此,都想著為自己爭取最優結果,所以才產生了出賣行為。現實情況中人們也往往會做出此類決策,導致無法得到最優結果。

基於博弈理論的基礎原型,書中介紹了一些具體博弈策略,根據產生條件和結果,我將其歸類為正博弈和側博弈。所謂正博弈,即是大家都想看的美好結果,互利互贏。上述“囚徒困境”在日常生活中非常常見,通常導致最後兩敗俱傷是因為沒有相互通氣並達成合作。所以要想走出“囚徒困境”,合作共贏是最首要的方式,古人云:單絲不成線,獨木難成林,合作共贏是永恆的最佳方式,大到國家外交,小到家庭關係,當存在利益相互牽制時,只有合作才會帶給雙方利益最大化。

然而有時合作本身也並不順暢,例如囚徒故事中信息無法傳達,相互沒法信任等問題都會影響合作的建立,因此有以為靠譜的“中間人”就顯得尤為重要,中間人不僅可以傳達雙方消息,還可以起到潤滑劑的效果,促成合作達成。合作有個很重要的前提,那就是重複博弈,試想旅遊區的一碗“面”為什麼敢賣出“天價”,而且輕易不會為遊人降價,為什麼他們不靠拉攏“回頭客”增加收益呢?遊區商家清楚地認識到這些遊客基本都是一次性的合作,從此不會再來,索性一次博弈就賺個夠,沒有重複性的博弈機會,也就不會有讓步達成合作共贏了——不會讓遊客吃的即便宜又好吃。


「書評」博弈論


合作是正博弈中一種優勢策略的方式,但合作本身也是一種博弈論。

合作經常會伴隨一些博弈現象出現,例如“智豬博弈”,“獵鹿博弈”,“槍手博弈”等。“智豬博弈”的故事中小豬習慣蹭著大豬的努力,不勞而獲得到充足的食物。現實生活中“抱大腿”的現象也時常存在,除了“小豬”本身受益者之外,我相信其他人對這類現象也一定非常反感,此種合作就不是建立在共贏的前提下,而是一方始終侵佔另一方的資源,難以維持長久,因此需要制定一些獎懲措施,拒絕投機者們搭便車。而“獵鹿博弈”與之不同,它體現的思維是在合作中一方的背叛會對另一方產生的阻礙,例如:如果兩個獵手一起獵鹿的成功率最高,如果一個人去獵兔另一個將毫無收穫,如果都去獵兔,則可以每人收穫一隻兔子。此場景中存在兩個納什平衡,如果兩人都去獵鹿或都去獵兔,至少會保證有食物可吃,但是往往有人就會背叛對方先去捕獵不同的動物,導致另一個人空手而歸。這時一個人的背叛所產生的影響對於另一個人來說就是毀滅性的,但該結果通常只會在資源被充分利用的前提下出現,而實際上大多時候資源未被完全充分利用,我們可以選擇“利人利己”的方式,在不損害另一方利益的前提下,提升自己的收益,這就是帕累託效率。

熟悉經濟學的朋友們一定知道邊際收益的概念,客觀事實上付出量和付出所帶來的收益量並不是完全線性相關,付出越是多的時候,所帶來的收益增長率越低,甚至有時看上去付出很多卻毫無收益,這就是帕累託效率的一個演變,因為可利用資源就是那麼多,無法根據大家的付出而無限分配,因此夏普利指出,需要用邊際貢獻來分配收益,這樣才能保證不傷害別人的利益條件下,滿足自己的收益。如果兩方突破邊際收益方法,爭搶資源,往往會導致兩敗俱傷,破壞了天然的平衡。

“槍手博弈”是棋局中同時存在多個博弈方時的簡化模型。三國時代就是典型的槍手博弈,三方總有實力差距,但又會相互牽制,因此三者通常使用的博弈手段就是結盟,當蜀吳弱時,聯手抗魏;當吳魏弱時,則聯合抗蜀,而其中一方又始終沒有能力戰勝另外兩國共同聯手的實力,才形成了三足鼎立的局面,持續數十年。由此可見只要選擇優勢策略,實力較弱也可以是最後的勝利者,“結盟”就是弱國的優勢策略,但現實場景靈活多變,如果實在找不出優勢策略,也可通過排除法,剔除出劣勢策略,這樣也可以對結果由很大的提升。

下面我們來看看側博弈,側博弈的模型與正博弈相異,它主要強調客觀事實無法滿足多方共贏情況下的博弈。

首先我們先來想象一個場景,當一個小偷在一片區域的不同小區行竊,而一名警察去進行抓捕,在可活動區域內小偷和警察都可去任何一個區域,以A號樓為例,可能出現的結果是:小偷和警察都不在A樓;小偷在警察不在;警察在小偷不在;小偷和警察在。如果小偷和警察都在A樓,則小偷一定被捕,此時警察的完全收益就是小偷的完全損益,因此稱之為“零和博弈”。小偷和警察在下一步去哪個樓都是完全未知的,他們都會採取隨機的方式決定接下來去哪裡,此時並沒有準確的目標,不會產生“純策略”,因此我們稱為“混合策略”。“混合策略”指策略人隨機地選取自己的策略。在現實生活中,採取混合策略的例子很多,最常見的就是猜拳遊戲,每一回合的對弈都存在不同結果的不同概率,日常使用時需嚴密計算,得到對於自己利益最大的概率方向,以獲取更多的收益。

“警察與小偷博弈”抽象的是目標完全相反的雙方,利益完全“零和”的情況。側博弈中還有目標相同的博弈場景,例如“鬥雞博弈”和“協和博弈”,當強強相遇,共同爭取同一份利益時,如鬥雞場上的雄雞,往往不能採用混合策略,隨即選取方法,而是要通過對對手進行分析,權衡雙方實力後,或高歌猛進,或急流勇退。按結果導向,此時一定會出現一方“膽小鬼”,原因非常簡單,因為此博弈的根本結果無非兩敗俱傷,或見好就收,當“膽小鬼”綜合權衡利弊後覺得撤退會保證一定收益的情況下帶來較小損失,那麼何樂而不為呢?“膽小鬼”的撤退往往也是有策略的,撤退的時機非常重要,既不能早也不能晚,早了會讓對手得寸進尺,晚了很容易全盤覆沒,因此“協和博弈”中強調及時放棄就格外重要了。霸王項羽就是活生生的例子,如果能夠及時意識到大勢已去,肯於放棄,早早撤回江東,待他日捲土重來,或許可以避免橫屍烏江的悲劇。在阿凡提的寓言故事中曾記一例:一夥強盜看上了村名家中的祖傳器皿,想要佔為己有,因此三番五次騷擾村民企圖得到寶物未果,阿凡提向村民提議,將寶物埋藏起來,並宣揚出去寶物遺失,果不其然強盜再也沒有出現。阿凡提其實應用了“協和博弈”中的焦土策略,可簡單理解為當雙方對峙不下時,可以通過增加對手成本的方式,破壞對方想要,使得對方失去行動目標,對峙自然消失。

以上策略基於成本原理,即所有事情都是有成本的,強盜在消耗很大成本的情況下卻毫無收穫,也就失去了搶劫的動力。在博弈論中成本是個非常重要的概念,它影響這博弈策略的制定,“路徑依賴博弈”就是成本原理的一種體現,在經濟學中它也被稱為“沉沒成本”,當人們為了一件事情付出了越多的心血,就會越依賴所獲得的趨勢,因為它已經積累了很多的沉沒成本,放棄意味著全部失去,所以在戰爭中,商戰中這種心理往往被人們利用。 曾轟動一時的“PUA事件”,事件中的“男導師”就是充分利用了這一原理,誘導女生們為他付出,但每次他都表示出不滿意並對女生們進行指責,而女生們認為自己已經付出了很多,卻還沒有讓對方滿意,與放棄之前的付出也就是所謂的沉沒成本相比,她們往往選擇增加付出,試圖挽回局面,卻沒想到正好中了該“導師”的圈套。


「書評」博弈論


從古至今,從故事到現實生活,我們每個人都猶如一個棋手,生活在一個巨大的棋盤上,我們進行的每一個行動都如同走了一步棋子,精明的棋手們相互揣測,相互限制,每個人都想追求自己的利益最大化。然而有些人卻渾渾噩噩,完全沒有意識到博弈重要性,甚至沒有意識到博弈的存在。因此本書將生活中常見的博弈思維進行了詳細介紹,讓沒有意識到的朋友及時認清博弈的原理,讓還在糾結策略的朋友正確做出決策。

本篇書評介紹了書中11種博弈的思維,並配上相應案例解讀,希望閱讀過的朋友在生活工作中能清晰地認識當下時局,充分理解人們各種行為之間的關係,做出正確的決策。


分享到:


相關文章: