我们总在听说博弈论,可博弈论到底有什么用?

逆向思维一下,也正是因为这些造物主制定的大规则,才让我们智人能够走到今天。

“博弈”无处不在,小到一局象棋,大到同行企业之间的竞争、国家之间的合纵连横。对应的英文就是Game,可想而知有多常见。

十几年来我很喜欢研究“博弈论”,今年在中欧工商学院的《管理经济学》又系统学了一遍相关知识,最近把“得到App”精英日课的“博弈论15讲”也听了一遍,今天就为大家结合商业实务聊一聊。

我们总在听说博弈论,可博弈论到底有什么用?


一、单次博弈

大家最耳熟能详的就是“囚徒困境”了。大意是,两个合谋犯罪嫌疑人(A和B)被逮捕,警方证据只够判轻罪,决定分别审讯:如果两个都不认罪,都判轻罪1年;如果都认罪,都重判5年;如果A不认罪B认罪,A“抗拒从严”判8年,B作为污点证人立即释放(反之亦然)。

从总体利益上来讲,“都不认罪”是最佳策略(合计判2年);可实际上,A和B都陷于“囚徒困境”—— 都不相信对方能忍受“坦白立即释放”的诱惑,所以都只能都“认罪”,从而产生总体最坏的结果:都认罪(合计判10年)。

类似的,还有“公地悲剧”—— 在小区门口有一块漂亮的公用草坪,每个人的最优策略都是享用草地而不付出精力保护,很快草坪变得破破烂烂,最终谁也无法享用,全都是loser。

在咱们SaaS行业里也经常看到这样的状况,为了抢夺一个客户,同行们每次遭遇战都报低价,目的是即便我不赚钱,也不让你拿到客户。更麻烦的是,SaaS厂家都觉得自己的新客户第一年不挣钱不要紧,反正还有续费。

可实际情况是,竞争激烈,为了鼓励销售,一次收了3年钱;

实际情况是,收到费用太低,实施和服务跟不上,客户压根没用起来;

实际情况是,这客户根本不会续费!

长期如此,厂商都不挣钱,VC的钱烧完了还见不到利润,显然也是一种“囚徒困境”。

那么,如何避免这样的“悲剧”呢?

我先讲讲我亲身经历的故事。十几年前我在华为软件“战略与Marketing”部门时,负责一个BMT(1000多人)的软件合作。我们运作了一段时间后发现,软件采购与硬件采购非常不同。硬件交付的是“产品”,抽检合格后集成到设备里保证高概率不会出问题。而软件公司提供的不仅仅是“产品”,还有大量实施和售后支持服务。如果价格压地太低,华为团队与供应商团队一起到客户端交付时就会有一堆问题,最终影响全局。

后来我们软件合作部门就决定,供应商认证和议标过程中,加大从“长名单”进入“短名单”的供应商认证门槛,提高“技术”部分的影响,降低“商务”(价格)部分的影响。以此保障客户端的交付质量。

这是什么?这是经历了“多次博弈”后的成熟表现。

我们总在听说博弈论,可博弈论到底有什么用?


二、多次重复博弈

上面的例子说明,多次重复博弈的情况下,“囚徒困境”是可以改变的。

当然我不是推荐搞什么价格同盟,实际商业中,3方及以上的价格同盟很难形成和稳固,而且这还是有违国家反垄断法的。

事实上,经过2、3年博弈后,竞争各方都会越来越理性,设法在产品定位上找到差异点,在营销过程中强调差异,在定价上保障收益率。这也是新生市场与成熟市场的差别——竞争者和客户(例如上面说的华为软件)都会更加理性。

说回博弈论,有一个非常有趣的多轮博弈模型,它证明在大部分多轮博弈过程中,“以牙还牙”策略是最优的。

举个例子,有100人参加一个Game,轮次无限,每一轮都是每个参赛者与另外99个参赛者逐一“博弈”。如果A遇到B,A出“合作”,B“不合作”,则A得“0分”,B得“5分”;如果双方都合作,则各得3分;如果双方都“不合作”,则各得1分。

我们称一直出“合作”牌的为“傻子”;称一直“不合作”的为“骗子“,除此之外,还有很多别的策略,例如“随机出合作和不合作”等。其中一个被证明最有效的是“以牙还牙”策略。

“以牙还牙”策略是这样:不管对谁,第一轮我都选择合作;第一轮后我就复制对手上一轮的做法(他上次出“合作”,我这次也合作;他上次出“不合作”,我这次也不合作)。

据《精英日课》万维钢老师讲,1980年代密西根大学的Robert Axelrod教授组织了一场博弈竞赛。

我在网上查了更多资料:第一轮,研究博弈论的经济学家和数学家等提交了14个程序(策略),其中包括很多复杂的策略。200轮重复博弈后,“以牙还牙”这个简单的策略胜出。

通报结果后,第二轮他又征集了62个策略。这次重复博弈的次数是随机的,出乎意料的,仍然是“以牙还牙”这个非常简洁的策略胜出了。

所以说,“以牙还牙”策略是简单、粗暴但非常有效的策略。“简单”这一点也非常有价值:你有一个好策略很重要,让对方知道你在执行什么策略也非常重要。

具体到现实世界,因为对方有可能出错牌(或对你的善意信号发生误解),如果双方都是“以牙还牙”策略,则可能陷入互相报复的死循环。因此,“以牙还牙”策略还有一个变种:连续被欺骗2次,下一次开始才会“不合作”(2报还1报)。

我们总在听说博弈论,可博弈论到底有什么用?


三、无限重复博弈策略的后果

这样重复博弈后,各种策略的人会得到什么样的结果呢?

经过经济学家们的模拟,结果很有意思。

《自私的基因》也用大篇幅谈到博弈论和Axelrod教授的“第三轮”博弈实验。第三轮实验的变化是,每一轮结束后,赢家不再得到分数,而是与其完全相同策略的“后代”。这样多轮之后,有的策略逐渐数目稀少,而有的策略则数目众多。1000代后,种群不再变化,稳定的状态已经形成。

大家可以想象,“傻子”多的环境下,“骗子”可以活地很好;但骗子数量越来越多、傻子越来越少时,骗子就活不下去了,骗子的数量也会减少。如果这中间还有很多“以牙还牙”者,骗子就会更难。当然,如果是“2报还1报”的改进型以牙还牙,骗子还是有一些空间。

我们把策略分为两种,“恶意”(设法通过欺骗获得更大利益)和“善意”(希望通过合作获得更大利益)。

总体来说,无论是通过数学逻辑推导,还是Axelrod教授的三场计算机模拟,甚至是《自私的基因》中的一些生物学实证,都可以发现,“善意”和“宽容”是更长期有效的竞争策略。这里的“宽容”是指允许对方偶然犯错。

这也让人类对未来有了更多的信心。

逆向思维一下,也正是因为这些造物主制定的大规则,才让我们智人能够走到今天。


分享到:


相關文章: