畅销书简读——《统计数据会说谎》

畅销书简读——《统计数据会说谎》

《统计数据会说谎》是美国统计专家Darrell Huff所著,自从上个世纪50年代出版以来就深受读者认同,作者为广大民众揭示了统计学领域惯常会出现的操纵伎俩,当时在美国社会还引起了民众、政府和媒体对于“社会统计数据信息”的关注和探讨。

1 《统计数据会说谎》内容总结

作者作为统计学家以其专业的视角为广大民众揭示了统计学领域惯常会出现的操纵伎俩,从最常见的基础统计数据指标着手以丰富的案例来佐证了“数据会说谎”这一核心内涵主旨。

2 《统计数据会说谎》内容分述

2.1 带有偏差的样本

社会调查中的某种群体的平均年度薪资收入和民意调查以及心理学研究实验中都需要按照科学抽样调查方法中的规范进行随机分层抽样,必须考虑到样本的规模、代表性以及排除可能产生的误差。

2.2 精挑细选的平均数

统计数据中的平均数包括均值、中数、众数。

所以当民众看到一些被公布的统计数据平均值时,就可以思考这个平均数统计数据到底是来自哪种被定义的群体,是用的均值、中数还是众数?

2.3 没有透露的小小数据

在许多快速消费品制造营销噱头的过程中容易使用较有误导性的统计数据,这普遍是使用了极小样本得来的观测数值,不具有代表性、推广性以及充满了极大的偏差。

2.4 无事瞎忙

智力测试的主要意图是获取规模性的智力样本,与其他抽样方法得出的结果一样,智商数据也会存在在精确性和可靠性方面的统计误差。

因此解读智商测试数据的规范方式是看数据在置信区间的范围,这也是代表性样本隐含的误差对其影响的结果。

2.5 惊人的图形

对于呈现同样统计数据的趋势线图,只要稍微将标刻尺度进行修改,就会达到天壤之别的效果。

2.6 一维图形

即便是在平面图中用一维图形展示统计数据之间的比对,如果两个数据之间相差一倍,用图形1和图形2来表示,则在一维平面中图形一比图形二小一倍,但是如果以三位的空间思维来思考,则图形二的体积是图形一体积的四倍而非两倍。

2.7 看似相关的数据

在社会生活中测量的统计数据有许多是基于错误的统计基础抑或是公布的看似相关联的数据实际上丝毫没有任何逻辑上的相关性。

2.8 因果颠倒

基于古老的谬误推理如果事件B发生在事件A之后,即会认为是事件A引发了事件B,这就是因果谬误。

2.9 如何操纵统计

操纵统计指的是统计数据测量搜集机构或组织为了实现其目的而对数据进行操控和发布以达到呈现的数据在受众中引发不同感受的伎俩。

2.10 如何反驳统计数据

“是谁这么说的?”,即找出偏差。

“他怎么知道的?”,即搜集或统计的科学流程。

“漏掉了什么?”即寻思数据的可疑程度。

“有人偷换了概念么?”即原始数据和最终结论之间是否一致和吻合,例如将相关关系替换成因果关系。

“这是否合乎情理?”即统计资料是否是以一个未经证实的假设为基础。

3 《统计数据会说谎》一句话评语

《统计数据会说谎》通过多方面数据案例的呈现和例证,作者一方面指出了统计科学领域可能会存在的缺陷和偏差,一方面对民众进行统计学原理和一些常见数据指标的科普并同时提醒着民众需要在理性的基础上从统计学工程流程的开始阶段至数据的发布结果各环节进行考证和反驳,书籍虽然根植于专业乏味的统计学专业庞杂繁复的知识,但通过作者幽默机智的笔调和深入浅出的叙述,将专业研究者关注并透彻明了的领域和问题通过通俗易懂的文字、有趣生动的图片表达得深受读者喜爱和接受。


分享到:


相關文章: