《统计陷阱》统计学与生活

《统计陷阱》这本小册子首次出版于1954年,这一点从书中大量引用的二战期间的例子即可有所感觉,但这并不影响本书对当下的适用性。你常常可以发现书中所列举的例子在当今知识更加普遍,比如广告行业当中大量存在的偷换概念的现象。统计作为一门科学在大众中的认知实在有限,然而我们并不需要阅读统计学教材——花一整个章节介绍置信区间的概念——才能学到有效的统计思维,大量的统计陷进都基于十分简单的原理:可以选择样本数据,将相关性解释为因果性。这本《统计陷进》对这些原理进行了十分清晰的概括,并且提供了大量的例子,作者在本书最后还提供了简单易行的方法来帮助我们识别这些陷阱。阅读这本书的过程使我再次感到人类的思维方式和认知过程存在无数的偏差,修正认知模式是需要长期不懈的坚持,获得理性并不是一时半会的事情。

  • 内在有偏差的样本

统计最基本的原理就进行样本抽样。从本质上说,抽样调查的方法基于这样一个假设:样本分布和总体分布相同。但这个假设并不总是成立的。样本本身可能存在问题,从而使的抽样获得的结果和整体实际结果相差甚远。样本的内在偏差可能来自许多不同方面,比如设计抽样方案的时候不具备代表性。完全随机抽样可以保证样本具有待料性,但因为获得样本的难度过大而一般在技术上不被考虑。更加常见的做法是进行封层抽样。再比如,用户在回答抽样问题的时候并没有提供完全真实的意见。比如我们可能处于私人原因故意高报或者低报我们的收入数据。对于这类调查,除了在设计问题的时候必须更为谨慎之外,使用其他数据源来验证调查结果可以增加结果的可靠性。总之,当我们遇到统计数据的时候,首先要问,样本是如何产生的,它们具有代表性吗?

  • 精心挑选的平均数字

统计报告中的平均数是一个十分容易被操纵的概念。从报告中看到平均数的时候,我们需要了解其统计学上的含义,其中包含的数据,最好是可以了解具体的统计分布情况。大众传播中平均数的概念和统计中的平均数有很大不同,它可以用来代指统计学上的平均数,众数和中位数。这三种不同的方法可以获得完全不同的结果。另外,通过故意操纵统计中的包含的数据也可以获得不同的平均结果,这在一些专业领域比如会计领域尤其常见。我们需要做到的是了解数据背后的统计学方法。

  • 没有披露的数据

统计报告当中经常缺乏一些关键性的数据使我们无法完全了解统计结果。最典型的比如样本数量和试验方法,样本的数量过小或者实验的方法不够科学都可能导致无效结果,降低报告的可信度。使用统计中的显著值可以使我们了解统计结果的可信程度。另一方面,当我们将统计数据运用到个人生活的时候,比如根据统计结果来衡量小孩是否发育正常,我们需要知道统计的分布等更多信心以正确的解读这些数据,比如和平均值偏差多少才值得担心,在每个区间之内各分布了样本。

  • 毫无意义的工作

在社会生活的许多方面,统计数据是毫无意义的,或者是不能完全反应事情的全貌的。比如一般的之上测验只关注与阅读和抽象思维的智能,而忽略了其他的智能比如社交智能。另外,测试方法的科学性本身也会影响结果,不科学的测试设计本身会导致无效结果。在解读统计数据的时候我们还想要知道结果可能出现错误的概率。我们一般使用标准差来衡量这样的概率。仅仅进行一次实验而得出的结果包含了太多随机成分。

  • 惊人的统计图形

在解读统计结果的时候,我们对于图形比对于数字更加敏感,这就为设置统计陷进提供了空间。在解读图形的时候我们更多的关注整体的趋势,因此可以通过有选择得绘制图形来改变人们对于统计结果的印象,比如调整折线图纵坐标的起点和尺度可以造成放大或者缩小实际波动范围的效果。这样的效果等同于带领读者从不同的高度看待统计数据:用放大镜观察看大部分数据都波动剧烈,从外太空看他们的变化可以忽略不计。我们甚至可以改变纵坐标的单位来获得这样的效果,比如进行一些高深莫测的数学转换。

  • 平面图形

为了更加直观的向公众传达统计数据的变化,有些报告会使用二维图形来描述这样的变化。其中一个常见的陷进在于:这些报告是使用二维的形象来绘制的,而当我们解读的时候却会将他们还原为三维的图形,因此二维尺度上的变化在三维空间就会被剧烈当大,很多报告正是利用了这样的心理误区来操纵人们对报告的印象。比如为了表现钢铁产能在十年间增长一倍,报告可能会使用一个两倍大的炼钢炉来表现现在的钢产量,但当我们阅读的时候第二个炼钢炉在我们脑海中是第一个的大八倍。

  • 不相匹配的资料

使用统计数据来误导公众的一个伎俩就是利用一些看不见的因素。比如我们会自动寻找统计结果和需要说明的事务之间的关联,而增加一些正面因素就可能导致我们在寻找关联回路的时候从正面的角度出发。广告行业是这个陷进的重灾区,比如通过强调数据来自权威实验室来暗示药物的灭菌效果和治疗感冒之间的联系,比如在展示化妆品效果的时候让模特笑的更加灿烂。

  • 相关关系与因果关系

最显著和常见的统计陷进也许是将相关关系混淆为因果关系。人类有进行因果关系推论的本能,认识到事务之间的关系可能包含多种解释需要理性,本能总是胜过理性。有很多事务之间具有很强的相关性,在这个前提下使用一种因素来预测另一种因素是可行的,但是试图因此归纳他们之间的因果关系则是荒谬的。比如受过教育的女大学生单身的比例要高于受过教育的男大学生的比例,这并不是说说受教育会导致女大学生单身,而很可能是因为想要保持单身的女性更可能会选择大学教育。找出事务之间的关联性并不是一件容易的事情,这有时候需要专业的知识和洞见,但我们能做到的是对任何因果关心保持怀疑态度,并经常进行寻找可能关联的解读。

  • 如何进行统计操纵

在我们选择如何向他人传达统计结果的时候,有很多办法可以操纵人们对于统计结果的想法。比如使用明暗对比明显的地图,混淆中位数和平均数,故意增加数字的小数位数以显得真实,使用百分数,变化数字使用的基数等等。这样进行统计操纵的现象无处不在,因为我们在表达结果的时候总是倾向于从有利于我们的角度进行解读,同时在如何传达统计结果的时候语言所特有的模糊性就派上了用场。比如我们不会说物品价格易碎,价格低贱而总是说它们轻便、经济实惠。

  • 对统计资料的五个问题

如何更好地识别统计数据中包含的陷进呢?作者介绍了五个问题来帮助我们了解统计数据背后的真相。

第一个问题是:谁说的。我们需要了解数据的来源,努力辨别数据背后有意识或者无意识的偏差。还要对那些看似权威的结构保持警惕。在细分的专业领域,看起来类似的机构其实只能相差万里。

第二个问题我们要问:他是如何知道的?调查使用的方法是什么?样本的选取合理吗?这些都有助于我们评判统计的过程本身是否科学严谨。

第三个问题是:遗漏了什么?调查报告的样本数量多大?统计上的可信程度有多高?如果报告没有披露这些数据,我们应当对报告表示怀疑。再比如,如果使用百分数而不报告原始数据,使用平均数而不告知样本的基数也是值得怀疑的。

第四个问题是:是否有人偷换了概念?比如病例的增多是不是以为这发病率的提高?还是因为统计手段的改进使调查者的已收集更多的样本?比如将中位数当做平均数来使用。在银行和金融这些和数字打交道非常频繁的领域,偷换概念是最值得警惕的问题。

最后一个问题是:这个资料有意义吗?许多统计结果所基于的假设经不住验证,即使有准确的统计数据这些结论也毫无意义。另外很多统计的结论是基于对数据的推广,比如根据当下的结果推论以后的趋势,而实际上统计的基础往往是随时间变动的。

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s