数据,你最为坚信的可能都是谎言



3月2日,大家都应该已经进入了正式复工的生活节奏当中。

回想疫情从爆发到蔓延的这两个多月的时间,我们大概从未有过跟一样事物如此频繁的接触与渴求,那就是数据。

每个人,其实对于周遭世界的感知都是非常朦胧和模糊的,因为我们日常的行动半径以及亲身接触的信息都太少了,20公里与150人的社交圈只够我们在脑海中构建自己的生活大概是什么模样。

那么世界在发生什么呢?于是媒体完全充当起我们外延的眼睛与耳朵,去展现更大范围的图景,而数据则成为最好衡量对比的标尺,就像三维建模中各种坐标数据,才逐渐丰满起世界在我们心中的模样。


中国有960万平方公里 VS 日本37.8万平方公里

2019年天猫双十一单日成交额2684亿 VS 2019年上半年王府 井营收134.22亿

某一线明星微博粉丝数 VS 某一线企业家微博粉丝数

某一线端游年营收 VS 某一线手游年营收

你的月收入 VS 你好闺蜜的月收入

......


你不必真的亲身了解这个世界,也可以拿着数字的标尺给这个世界打上大大小小的横纵坐标,再接着涂抹色彩去构建你认为世界的模样,以及它们跟你有什么关系。

但,关键问题是,在这个后真相时代里,如果你所知道的数据都是骗局的话,都无法还原这个世界本来面貌的话,你对这个世界的理解就可能出现偏差甚至刚好相反,你的行为就极有可能被错误的数字所操控。换句话说,你就有可能成为“数据捏造者”有心引导的“傀儡”——数据傀儡。

所以,每个人都有必要了解一些统计学的缺陷以及数据本身的悖论,而不是任由本能把持、观念作祟,我们都应该有一双洞察真相的眼睛。


01、幸存者偏差


1940年,第二次世界大战,英德两国的空战让双方都损失惨重。英方研究专家决心提高飞机的装甲厚度来增加飞机的防御力,但由于重量所限,不能全机覆盖,只能按照被攻击的几率大小来决定。于是,英方专家研究了从空战归来的战斗机状况,发现飞机上被攻击的弹孔大多集中在机身中央以及极机翼部分,于是给出了加厚这两处的装甲的提议


请问,这样的提议有问题吗?

当然有问题,它被美国军队统计研究部直接否决了!

那么问题出在哪里?问题就在于被研究的飞机全部是战场上的幸存者,它们身上虽然弹孔密布,但正是没有被击中要害才得以返回,也就是说加强这些部位的装甲是没用的!

正确的研究应该以没有着弹的部位来进行,正是因为这些地方没有被击中,飞机才得以幸存!



遗憾的是,这种选择了幸存者而导致的数据统计样本偏差,是目前统计数据“统计偏倚”的普遍问题,它忽略了统计样本的全面性与随机性,抛弃掉了那些没能被收录进选择样本的隐藏样本。

更为严重的是,这个本可以通过样本筛选来尽量减轻误差的现象,也正在被很多数据统计主体,有意图地利用着。


比如,有一个网课机构的广告上显示,网课的好评率为97%。当你看到这个数据时,很自然会联想到这门网课的质量应该不错,绝大多数人都给予了好的评价。

然而现实是,这个97%的数据是来源于给予网课反馈的人来计算的,网课不同于网购商品,有退换货的售后需求,愿意在学完以后再次打开页面撰写反馈的人,绝大多数都是认可网课的受众,而学完网课觉得没有帮助的人群是大概率不会费这个周折的。

也就是说,这个97%仅仅可以看作是“愿意给这门课反馈用户的好评比例”,而“并非所有网课学员的好评比例

如果将所有学员样本都统计进去再进行计算,那个比例值得不值得拿来宣传,就是另一回事了。


此外,幸存者偏差还会影响到企业和个人无意识的信息收集出现错误。

比如最经典的辩论题“是顺境出人才还是逆境出人才?”

绝大部分人的第一反应应该是“逆境出人才”,毕竟见过了太多寒门学子一朝成名的新闻,从小也被教育吃得苦中苦方为人上人之类的话,而事实却正好相反——的确顺境更容易出人才,足够的财富、环境、人脉支持更容易造就高等级的人才,想想收入财富的“马太效应”也可以明白,肯定是优越的人更优越。那为什么人会产生“逆境出人才”的错觉呢?

1、顺境出人才的事情理所当然,它成不了大众媒体的新闻素材,它成为了隐藏样本。

2、逆境出人才太难得了,它必须被当作典范。

每一个顺境的人才都是飞机上没有被子弹击中的部分,它才是真理所在。

所以,数据虽然真切如斯,但你在你全盘接受之前,是不是值得问一句:这个数据背后的样本是什么呢?


02、数据立场


数据,的确中立且精准,用数据组合成的公式被各种学科框定成解释世界的真理。

所以我们对数据,有天然且魔幻的信任感。

但殊不知数据虽然中立,但公布数据的人或者机构是有立场的,这种立场被有心人拿来迎合我们的心理惯性,让我们对同一样事物产生截然不同的相反认知,甚至动摇我们的价值观。

(以下是我多年广告及品牌策划的经验所得,它们有些已经成为了营销技巧的潜规则)


大数拆分


一架名牌钢琴的售价为12万人民币,这对于大多数家庭来说都不算个小数目。一下子需要付出一年甚至更多收入才能买到的东西,人往往是谨慎且克制的,不仅需要多家对比,还对细节苛求到无以复加,这当然是商家所不乐见的,所以商家给出了这样的广告语:

“每天一杯咖啡的花费,为你孩子的整个适龄做最有价值的艺术投资。”

是不是看到那个昂贵价格的心理压力瞬间就没有了?谁每天还不花上一杯咖啡的钱?而且这是什么,这是对孩子最有价值最值得的投资!还有比这个更不用考虑现在就应该行动的消费?

然而这个数据是假的吗?也不是,商家是用12万平均到从5岁到15岁这学习钢琴的十年中来计算的,你找不出它的逻辑漏洞。商家就是读懂了人心的损失厌恶,既然你心疼花掉这么一大笔钱,那就只给你看小钱就好啦!

从房产到汽车,从奢侈品到珠宝,但凡是高定价商品,你一定会看到这样的数据策略,这时候中立的数据站在了商家这边。

这个方法还有反例,也可以将实际很小的数据变得巨大,从而引起你的恐惧和重视。


细节真理

有这么两句广告语,看看你会更相信哪一个?

1、有80%的用户都成为了我们的回头客

2、有79.32%的用户都成为了我们的回头客

绝大多数人都会选第二个!你选对了吗?

人总是相信,具体的数据比规整的数据更真实可信,那些细致到小数点后面好几位的才像是真正统计出来的,而完全是整数的数据?哪有这么巧的事情,一定是假的!但是真实情况是,以上这个两个都不是真的。同样是数字,却有了不同的立场!


目标趋近

最近随着拼多多APP的流行,社交裂变式的红包被开发到了极致。

中间有一种红包是这样的:它会以一个超大的数额引起你的注意,比如“你有90元的红包尚未领取”,见惯了几块钱红包优惠券的大家当然毫不犹豫点了进去,发现居然真的是90多元,那还不赶紧提现?接着系统跳出来提醒你,需要100元才能提,就差10元了,让你的朋友帮你点一下,百元红包唾手可得啊!

一旦开始分享,你就跳进了系统的分享裂变陷阱,别看只有10元的差距,基本上你需要邀请三十位以上的朋友帮你点你才有可能得到提现机会。

先不算2020年的今天一个真实客源的引流成本高到百元这个机制有多划算,换一个思路来看,如果当初你收到的是一个没有额度的分享机会,你拉来三十个好友也能收到100元回报,你有多大的动力会把这个事情做下去?

是的,90就是推向你去100的充沛动力,就像是赛跑时横亘在眼前的终点线,你尽管已经精疲力竭,还是会咬咬牙冲刺抵达。


以前,总觉得白纸黑字是真理

后来觉得眼见为实是真理

再后来我也笃信数字

现在我才渐渐明白,我该坚信的不是某样方式、某样工具,而是洞悉事物的视野与思考。

大脑是懒惰的坏孩子,它喜好悠闲,讨厌思索。

于是,我们有了标签,去忽略人与事物的多样性,简单定型一种价值;我们也有了KOL,只要跟着走就不会在纷杂中迷失方向;我们还有数据,我们拥抱数据仿佛拥抱真理。

独立思考,请至少学会这个。

它能帮你,更能救你!


参考书目:

得到APP 万维刚《精英日课4》

莱尔·哈夫《统计数据会说谎》

赫克托·麦克唐纳《后真相时代》

加里·史密斯《简单统计学》