美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

戏剧化的专家预测

环球时报报道,中国疾病预防控制中心主任高福院士,对新冠的预测颇为戏剧化。

2019年3月4日,时值当年两会期间,高福院士曾经发表报告表示,中国不会再出现17年前的SARS病毒;SARS过去16年确实没有再出现,但该报告仅发表不到一年,就出现了与SARS同属冠状病毒的新冠病毒。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

其实严格来说,高福院士的预测也可以说并没有错,即便是出现的新冠病毒和SARS一样是冠状病毒,但它毕竟也不是SARS病毒。

但如果预测的只是SARS病毒,这样的预测价值并价格可能不是特别大。

美国决策专家奇普·希思和丹·希思在《决断力》一书中,甚至进一步用数据说明专家的预测,本身就并没有特别准确。

如果说盲目认为一个事情对或者不对都是偏见,那认为专家预测一定准确,也是一种偏见。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

8万多个专家预测数据

美国国家科学研究委员会(National Research Council)的泰特洛克(Phil Tetlock),收集了284个政治、经济、生物、物理、天文等多个领域专家的简单预测,并在多年后,检验他们的预测结果,计算他们的预测准确度,研究结果在其著作《专家的政治判断》中发表。

泰特洛克为了检验不同领域的专家的预测正确率,对不同领域专家使用了不同问题,且这些问题都非常直观,可检验。

例如对经济学家的问题是:你预计2年后,美国的GDP增长率会加快还是减缓。

例如对政治学家的问题是:你预计在下一届美国总统选举后,目前的执政党,会失去控制权,失去部分控制权,还是保留控制权?美国政党的控制权可以通过数据获得。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

类似这样的预测和结果检验,泰特洛克获得了82361个数据。

比较:专家预测和粗略外推算法

另外泰特洛克对每个专家预测数据,都使用“粗略的外推算法”计算结果比较,看哪个更加准确。

粗略的外推算法,简单来说,就是假定过去几年发展趋势不变,未来也不会遇到意外情况,从而预计未来的结果。

例如过去3年美国的经济平均增长是2.8%,粗略的外推算法就预测两年后,经济增长也是2.8%。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

最终,专家和粗略的外推算法比较结果,非常让人吃惊:最优秀的专家预测的预测准确率,都不如“粗略的外推算法”。

要知道,粗略的外推算法,只要知道过去的数据,即便是十几岁少年,都可以直接计算出来。

也就是说,最优秀的专家的预测能力,都不如一个少年通过“策略的外推算法”机械计算的结果。

而且不单只政治学家经济学家,连心理学家、医生、工程师、律师、汽车修理师,在预测的时候,都不如“粗略的外推算法”。

然而这样就迎来了一个问题:专家的预测还有价值吗?

专家预测是否有价值?

泰特洛克除了对专家预测和粗略的外推算法预测相比较,还对某个领域的专家和初学者的预测能力,进行了测试。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

测试结果是,初学者认为某个专业的预测100%会发生的时候,错误率却高达45%。

相比之下,专家预测某个事情100%会发生的时候,错误率只有23%。

专家预测能力还是优于初学者,以及非专业者。

显然专家的预测,还是有一定的价值。

但泰特洛克给所有人,包括专家和普通人的意见是:在我们做预测的时候需要更加谦逊一些,只要有可能,最好避免预测。

专家的真正价值

泰特洛克认为,专家最大的价值,并非在预测,而是在专家掌握的过去的数据和知识,甚至一些只有专家通过实验知道的数据和知识。

即便是任何专家预测准确率都高的“粗略外推算法”,也是基于掌握的过去的数据和知识的基础上进行的。

美国决策专家:最优秀的专家的预测能力都不如一种机械预测方法

例如一个生物学专家,它的预测也许不一定准确,但是他的实验数据,是可以有科学依据的。

在看一个专家的研究时,更重要,应该看他的实验方法的可靠性,以及可靠方法下的实验数据,而不是仅仅看专家预测结果。

换句话说,我们跟专家沟通的时候,最应该关注的是专家的做过的实验和数据的细节本身,而不是专家的预测结果。

参考文献:

01.《决策力》奇普·希思、丹·希思

02.《专家的政治判断》(Expert Political Judgment: How Good Is It? How Can We Know?)菲利普·泰特洛克(Philip E. TetloCK)

03.《舆论漩涡中的高福院士》环球时报


分享到:


相關文章: