恶搞统计数据:小心媒体用统计忽悠人(3)

  • 数字总是看起来很正经,尤其是来自大媒体的统计数据,的确挺容易忽悠人的。但是要知道,随便在里面搞点小动作,就能达到特定的宣传目的……

继续此前的话题,关于撒谎者是怎么愚弄你的。

如果您还没有读过前面的两部分,在这里看到:《“让数据说话”只是个唬人的幌子:识破谎言(1)》《数轴有鬼:用数据可视化撒谎很简单(2)

谎言是人类文明的一部分。如果这样说会让你感觉不适的话我非常抱歉,但事实就是这样,人类是动物界最会撒谎的物种。

而且,如今在高科技的支持下,谎言正在以前所未有的趋势发酵、以前所未有的高速度扩散。

就如我们在“战略性欺骗”系列话题中所分析的,谎言完全可以作为有利武器来使用,潜移默化中令目标人或群体做出不利于自身的荒唐决策,甚至可以长期虚弱人们的判断力 —— 因为认知一旦建构就很难被推翻

这种现象体现在两个方面:1、人类的语言究竟是在论述事实还是在编造事实,已经越来越难以分辨,因为人们说的每一句话几乎都是有目的的;2、教育的匮乏,已经对几代人构成了严重的影响。

这两个方面都无法通过几篇文章改变,但至少我们可以把最常见的忽悠总结起来,集中分析一下;只要有更多人认识到这些问题,加入到抵制虚构和隐瞒的斗争中来,真相回归就能很有希望。

这就是本系列文章的目标。

谎言危害的不仅仅是民主,更有每个人的切身利益,随时随地的、白花花的银子……要知道任何时候都有一大群人在瞄准你的钱包,忽悠就是他们最强大的抢劫工具。

考虑这样一个例子。你正在考虑是否应该购买一个新款汽水的股票。你正在努力思考,这时从该公司的年度报告中偶然发现了这样一张销售数据图:

这张图显示该公司的销售业绩非常不错 —— 销售额呈现稳定增长趋势。你会就此认为现在购买其股票没有任何问题?

但是,别忙,此处应该运用一些现实知识。

汽水市场的竞争非常激烈,虽然该公司的销售额正在增长,但也许并没有竞争对手的销售额增长得快。

作为一名潜在的投资者,你真正需要的是分析该公司与其他公司的销售额对比情况。或者是,分析该公司的销售额随着其所占市场份额的变化而呈现的变化。

当市场快速发展时,该公司的销售额有可能只是略微上升,而其竞争者的市场收益则更大。

下面展示的是一张双Y轴图,你会看到,这家可乐公司的发展前景并不乐观:

如我们在前面文章中所演示的,不道德的绘图者能够通过修改图中右侧的Y轴,使图呈现出他们想要的任何内容,但是此处这个双Y轴是没问题的,因为它的两个Y轴分别代表不同的内容,其数量不可以共用同一个数轴。

看一下该公司的盈利情况也有助于你做出买不买的明确决策:利用在生产和销售方面的效率优势,该公司极有可能在销量较低的情况下获得更多的利润。

请注意,有人援引了一项统计数据、或者向你展示了一张图,并不能表明他们所持有的观点得到了证明

你需要做的是确保自己得到了真正重要的信息,并忽略掉那些无关紧要的信息。

下面再看一个例子。

假设你在一家公司的公共事务办公室工作。该公司生产一种叫作 Frabezoid的玩具。

在过去几年里,由于公众对该产品的需求一直很大,其销量逐年增长。通过新增生产设施、增加员工人数,以及为员工升职、加薪,公司扩大了经营规模。

但是你的上司对你说,公司最近的销售报告出来了,同上个季度相比, Frabezoid 的销量下降了 12%。

公司总裁即将召开一次大型新闻发布会,商谈公司未来的发展前景。

总裁在召开发布会时有一个惯例,就是要在身后的大屏幕上向与会者展示一张大图,以便介绍产品的销售情况。

销量下降的事实一旦传扬出去,公众就有可能认为 Frabezoid不再值得拥有了,这种情况会导致销量进一步下跌。

这时候你该怎么做?

如果你如实绘制一张过去4年里 Frabezoid 的销量图,那么这张图就应该是这样的:

图中曲线呈现的下降趋势正是问题所在。

要是能把这条线变成上扬该多好呢……

是的,的确有办法。

你可以绘制累计销量图。不要按照每个季度的销量来绘图,要使用每个季度的累计销量,即 目前为止的总销量。

所以,哪怕你只卖出了一件商品,累计销量图都会呈现增长趋势,就像下面这样:

看起来不错是吧。如果仔细观察这张图你仍然可以发现一些蛛丝马迹,它们依旧表明了上季度的销售状况比较糟糕。

你能看到曲线的上升坡度变小了,这就是销量下降的线索

不过,人们的大脑并不擅长觉察这样的变化率(在微积分中叫它一阶导数,即 曲线斜率)。

因此在平常人眼中这张图似乎说明该公司的销量表现依旧强劲。

这种做法一点都不奇怪。苹果公司在2013年的 iPhone手机销售会议上,Tim Cook 采用的就是这种方法

2013 The Verge, Vox Media Inc

这就是今天第一个要说的骗局。

在同一张图中绘制不相关的事物

世界上有如此多的事物同时处于不断的变化之中,所以必定会出现一些巧合。看过蝴蝶效应的电影吗?

比如公路上卡车的数量和你的薪水同时在增加;你小时候的电视节目数量随着你的身高增长而增多……

但是这并不意味着其中一件事的变化*引发*了另一件事的变化。

请注意有人会在此处设计骗局。当两个事物互相之间产生关联时,不论其中的一个是否*引发*了另一个,统计学家都把它们称之为“相关”

⚠️请谨记这句法则:相关并不暗含着因果关系。

形式逻辑对这个法则做了两种系统的阐述:

(1) 在此之后,即 以此为因。

这种逻辑谬误产生于这样的认知:认为由于Y发生在X之后,所以X导致了Y的发生。

人们一般都会在早晨上班之前刷牙,但是刷牙并不是上班的原因;你放了一个屁,然后你女朋友跟你分手了,那个屁很可能并不是分手的原因,如果你今后担心自己的屁而不敢找新女友那就太亏了。

尤其是在人们不知道当下的事为什么会发生的时候,这种逻辑谬误被使用的可能性最高。

的确每件事的发生都是有原因的,但经常不是源于此前发生的其他可见的事。这种联想在自我审查方面特别常见,比如一个人的推特账户被冻结了,大多情况下第一个设想的就是“我此前发布了什么东西?”

这种自我审查经常会比实际的情况更加苛刻,导致账户解冻后持续限制言论自由。(账户冻结的情况有可能源于监测到入侵,或者你允许太多机器人关注你,被视为与trolls宣传网络相关等等,当然还有来自你的仇家的恶意举报)

⚠️并且,媒体经常会使用这种方法来引导舆论,特别能唬人;而且你还无法指责他们,因为他们在措辞上并没有强调相关性,只是摆出了两件事前后发生 —— 而相关性是读者自己联想出来的,这就叫宣传的“润物细无声”。

遇到这样的新闻报道请仔细想想,为什么媒体要提及“此前发生了事件A”,而不是事件B、C、D……?只因为A才符合宣传意图。

(2) 与此同时,即以此为因

这种逻辑谬误产生于这样的认知:认为两件事同时发生了,其中一件事必然是另一件事的原因。

为了透彻地说明这个问题,哈佛大学法学院学生泰勒·维根(TylerVigen)曾经专门编写了一本书并创建了一个网站,全部以“假性共存 — 相关”作为专题,比如下面这个:

解释这张图的方法有四种:

  • 溺水死亡导致了的电影上映;
  • 尼古拉斯·凯奇的电影上映导致了游泳池溺水死亡事件的发生;
  • 第三种因素(尚未查明)导致了上述两个事件的发生;
  • 它们两者毫不相干,其表面上的相关性不过是巧合而已。

如果把脑子关闭你就可以宣称“该研究证明了尼古拉斯·凯奇的电影具有防止溺水的作用”;或者“防止溺水的有效方法是让他少拍电影”。

你还记得萧敬腾和下雨之间的关系吗?似乎流传甚广。

💡在一些情况中,具备相关性的事物之间其实并没有实际的联系,它们的相关仅仅是巧合而已;而在另外一些情形下,人们可以在相关的事物之间找到某种因果联系,或者至少可以编造一个合理的说法以便获得新的数据。

如果你认为是由于人们沉迷于尼古拉斯·凯奇的电影情节,而导致了失足落水?但是对电影的沉醉也可能同样提升交通事故率和重型机械的受伤率等等,为什么只是溺水?在做更多的数据分析之前一切都是未知的。

⚠️做这种相关联想也是媒体很常用的宣传手段。

就如2018年末推特封锁账户事件中,由于其中一个被封锁的账户是中国异议人士吴淦的声援者,于是一大群媒体都在讲述“推特审查中国异议”的故事。

但是与此同时被封锁的账户还包括IYP,还包括至少一位非常活跃的特朗普粉丝,但从来没有被媒体提到过。

因为其他案例会打破结论的逻辑和理性吗?难道不是通过案例分析得出事实、而是为了满足于特定结论去寻找能支持它的案例?

请不要误会,谴责推特等监视资本主义巨头的审查是IYP的主题之一,我们非常希望能证实推特在扼杀言论自由,证据越多越好,我们的去中心化倡导将有希望更快速实现。

但必须是证据。⚠️如果被人们发现你的声称中任何一点不是证据,人们就会怀疑你的一切目的,包括你倡导的去中心化 —— 不论你的目标有多正义,这点都是无法避免的。活动家尤其需要注意这点。

关于《什么是证据》详见这篇文章的分析。

对于尼古拉斯·凯奇的例子,你甚至还可以猜测第三种因素,比如经济发展趋势:经济发展得更好会促使人们在娱乐休闲活动方面增加投入,制作的电影越来越多,越来越多的人会去度假和游泳……

如果真的是这样,那么图中描述的两件事 — — 尼古拉斯·凯奇的电影上映和游泳池溺水死亡,都不是彼此出现的原因;而是经济发展导致了两者的发生。

统计学家将其称为解释相关性的第三种因素。这类例子非常多。

事实上可能性较大的情况是,这两件事情并不相关。如果你仔细研究一下就能知道。

RandallMunroe 曾经在他的网络漫画《xkcd》中描述这个问题。有两个明显都是大学生的火柴人正在交谈。其中一个说,他以往总认为相关性暗含着因果性。后来,他去上了统计学课程。现在,他不再这样认为了。另一个学生说:“听起来好像统计学课程起作用了。”第一个学生回答说:“嗯,也许吧。”

欺骗性插图

利用统计学说谎的人(尤其是媒体)经常会使用信息图来引导舆论,⚠️他们之所以能成功正是因为大多数人不会深究。

请思考下面这张图,它完全可以用来吓唬你,让你相信恶性通货膨胀正在吞噬你的血汗钱。

乍一看,这张图的确很吓人。

但是稍微观察一下你会发现,图中的剪刀位置并不是整张纸币的4.2%处,而是大约42%的地方。

⚠️当你的视觉系统和逻辑思维系统二者产生矛盾时,除非你费尽全力去克服视觉上的偏见,否则最终获胜的往往都是视觉系统

准确的信息图是下面这样,但它给人情感上带来的冲击力却弱化了很多是吧:

解释中出现的问题

一般情况下,统计数据的收集和汇报都能比较恰当。

但是,对于某些人来说,比如记者、律师,以及任何非统计学专业的人,他们在报告统计数据时往往会犯错。

要么是因为他们误解了统计数据,要么是因为他们没有意识到措辞方面的一些细微变化会改变其含义,再或者就是故意的,为了一个固定的宣传目的。

在运用统计学知识的任何阶段,比如在实验性设计,数据的收集、分析或解释过程中,都会出现使用者不能胜任统计工作的情况。

结果就是,报告的统计数据有时并不恰当。

考虑这样的例子。如果你正在说服股东,让他们相信你的公司经营状况良好,那么或许你会发布有关年度销量的统计数据,并且向他们展示公司的销量呈现稳定增长的趋势。

然而,如果你的公司产品的市场正处于扩张期,那么产品销量的增长原本就是可以预见的。

投资方和分析人士真正想要了解的极有可能是你的公司的产品的市场份额是否出现了变化。

假如由于竞争者突然发难,抢走了你的消费者,导致你的市场份额出现下滑趋势,那么怎样才能使销售情况报告仍然看起来很有吸引力呢?

很简单,你只需要对真正相关的市场份额统计数据不予报告,而代之以报告销量的统计数据就可以啦。销量在不断上升,一切都没有问题!

类似的例子非常多,都很能唬人。

人们在25年前的按揭申请中所显示的财务状况,对于建立今天的风险模型来说,很可能没有什么用处。网站上的消费者行为模式很快就会变得过时。

建造过街天桥时所用的混凝土的整体性统计数据,与统计建设桥梁所用的混凝土的整体性数据,也许毫无关联(即使两个建设工程刚开始时都使用了同一种混凝土,湿度和其他因素也有可能使其出现偏差)。

你可能听说过类似“4/5的牙医都推荐患者使用高露洁牙膏”这样的说法。这是真实情况。

这些已有几十年历史的广告,其背后的广告代理商想让你相信,牙医们最看好高露洁而非其他品牌的牙膏。

但是,这并不是真实情况

英国广告标准局曾针对以上说法展开过仲裁调查,并最终裁定它是一种不公正的说法。

其原因在于,高露洁公司的调查问卷允许牙医们推荐的牙膏不止一种。

事实上,高露洁最大的竞争者的品牌名称在该问卷中出现的频率几乎和高露洁一样(但是在高露洁广告中你却看不到这个细节)。

⚠️如果你不仔细思考人们传递给你的信息,那么凭借对统计样本单位的操纵,人们就可以用无数个手段来欺骗你。

有线电视网络公司 CSPAN(美国一家提供公众服务的非营利性媒体公司,由美国有线电视业界联合创立)的一条广告声称,其服务范围“可覆盖”一亿个家庭

请注意,这并不意味着有一亿人在收看 CSPAN 的节目,甚至还有可能意味着没有任何一个人在收看它的节目。

然而人们往往很容易将注意力集中在“一亿”上。

对统计样本单位的操纵还能够影响公共政策。

一项针对洛杉矶市区各街道垃圾回收量的调查显示,其中一条街道的垃圾回收量是其他街道的2.2倍。

在市政局为该街道的居民颁发奖章之前,先想想看,为什么会出现这样的数字?

一种可能的情况是,这条街道的居民人数比其他街道多两倍以上 — — 也许是因为街道很长,也许是因为该街道上有很多公寓楼。除非整个市区的街道都相同,否则,以街道为单位来衡量垃圾回收量就是不恰当的统计。

更好的统计方法是按照住户(衡量每个家庭的垃圾回收量)来统计。

由于人口多的家庭的物质消费比人口少的家庭要多,所以以个人为单位统计垃圾回收量是最好的做法。

也就是说,要调整垃圾回收数量的统计样本的单位,把街道上的居民人数考虑在统计当中,因为这才是这项统计工作正确的统计样本单位。

媒体经常使用这样的统计糊弄人。

2014年,整个加利福尼亚州干旱肆虐。同年,《洛杉矶时报》对加州兰乔圣菲市的居民用水情况进行了报道

“ 9月,该地区住户平均每天耗用的水量几乎是加州南部沿海家庭每天用水量的5倍。这为他们赢得了‘全加州最大民用水挥霍者’这个不光彩的名声”。

但是,住户并不是这项统计真正恰当的统计单位。

更好的统计单位应当是个人 — — 一种可能性是兰乔圣菲市居民的家庭规模更大,这就意味着洗澡的人更多,洗碗的人更多,使用冲水马桶的人也更多。

另一种可能性是,以英亩为统计单位,兰乔圣菲市住户的家庭占地面积往往更大。

也许为了防火和其他原因,住户在土地上都种上了绿色植被。所以,兰乔圣菲市住户的占地面积虽然较大,但是每平方英亩消耗的水量却并不比加其他地方多。

上述文章的问题在于,它们对数据做了调整,目的是使兰乔圣菲市居民的用水量看起来好像超出了配额

但是,它们提供的数据实际上并没有证明其目的。

💡采用计算比例而不是计算实际数字的方法,往往有助于提供正确的统计样本单位。

假设你是一家公司的西北地区销售经理,负责销售的产品是通量电容器。虽然你的销量已经提高了很多,但仍然比不上公司销售方面的对手 — — 来自西南销售区的人。

这几乎没有公平可言,对方负责的地区不仅地理面积更大,而且人口更多。然而,公司会根据你向上级展示的产品销售能力发放奖金。

有一种方法可以合理地汇报你的销售业绩:根据你负责地区的面积和人口来汇报销量。

换言之,在绘制销量图时,要按照销售区内平均每人或每平方英里的销量,而不是按照销售总量。

采用这两种方法中的任何一个,你的销售业绩都会看起来比别人更优秀。

新闻报道表明,2014年是飞机失事最为严重的年份之一:全年发生22次飞行事故,造成992人死亡。但是,如今的飞机其实比以往更加安全。

这是由于现在的航班数量比以往多得多,992的死亡数字相对于每100万名乘客(或每100万英里的飞行距离)的死亡数字来说,其实代表着很大幅度的下降。

在一家主流航空公司的任何单程飞行过程中,你死于飞机失事的概率大约为五百万分之一 —— 这比你死于其他任何活动的概率都要小,比如步行穿过街道和吃东西(噎死或食物中毒致死的概率比死于飞机失事的概率还要高1000倍)。

在此处,⚠️比较的基准非常重要。

这些统计数据的时间跨度都是一年。我们还可以改变统计基准,转而分析一小时内这些活动的情况,而这将改变整个统计量。

似是而非的差异

在试图弄清楚两个待处理对象之间是否存在差异时,常常需要运用统计学知识:同一块土地上施用的两种化肥、两种不同的止痛药、两种截然不同的教学方法、两组不同的薪水(比如,做同一种工作的男人和女人的薪水)。

两个待处理对象存在差异的原因有很多种:它们之间可能确实存在差异;统计样本中可能存在混淆因子,它们却与实际的统计对象毫不相干;计量方法可能有误;还可能存在随机变异 — — 出现了一种小概率差异,它有时出现在方程的一边,有时出现在另一边,这要取决于你查看的时间。

研究者的目标在于寻找稳定、可靠的差异,而我们则要努力把差异和实验误差区别开来。

⚠️请注意,对新闻媒体使用的“显著”一词的方式一定要保持警惕。

因为对统计学家来说,这个词语的含义并不是“显著”。

统计学中的“显著”指的是统计结果通过了数学测试,比如t测验、卡方检验、回归分析以及主分量分析等(这样的测试方法有几百种)。

统计学意义上的显著性测试,可以对用纯粹巧合解释统计结果的容易度进行量化。

当统计对象数量庞大时,即使程度上很琐碎的小差异都能够超出变化和随机模式解释的范围

这些测试并不能知晓哪个差异具有显著性,这是一种人为判断。

在两个统计群组当中,你的统计对象越多,就越有可能找到各个统计对象之间的差异。

假设我要测试两种汽车 — — 福特汽车和丰田汽车的年度维修成本,我所采用的方法是,看一下每种汽车(各10辆车)的修理记录。

比方说,假定福特汽车每年维修成本的算术平均数比丰田汽车高8分钱。这个小差异极有可能达不到统计学意义上的显著,而且很明显的一点是,每年8分钱的维修成本差异不会成为选择购买哪种汽车的决定因素 — — 由于差异太小,因此无须考虑。

但是,如果我看的是500000辆汽车的修理记录,这个8分钱的差异便具有了统计学上的显著性。

但是,从实际意义来说,这个差异却无关紧要。

类似地,一种治疗头疼的新药物可能在统计学意义上能*更迅速地*治愈你的头疼,但如果只是快了2.5秒,这……你真的觉得它很重要吗?

内插法和外推法

提问:星期二,你走到花园,看到蒲公英长到4英寸高。星期四,你又看了一眼,蒲公英已经长到6英寸。那么,星期三时蒲公英有多高呢?

没人知道确切的答案,因为没人在星期三时测量蒲公英的高度。

但你却可以猜测:星期三时蒲公英的高度有可能是5英寸,这就是内插法。

内插法指的是利用已知的两个数据点,估算出你想要知道的位于这个两点之间的那个点的数值。

那么6个月后,蒲公英会长到多高呢?

如果它每天生长1英寸,你就可以回答说6个月(约180天)后它将长高180英寸,长到186英寸,或者说高度超过15.5英尺。

此处,你所使用的方法就是外推法。

但是你见过这么高的蒲公英吗?一般人都没见过,那基本是怪物。

因为当蒲公英长到一定高度时,其自身的重量会把它压倒,或者它会死于其他自然方面的原因,或者被人踩踏,又或者会被除草剂除掉。

内插法并不是一种十全十美的方法,但如果两个观察对象相互间的关系非常紧密,那么使用内插法一般都能做出较好的估计。使用外推法的误差则更大,因为你的估计已经超出观察对象的范围

一杯咖啡的温度降到室温所需要的时间是由牛顿热力学定律决定的(还受到其他因素的影响,比如气压和杯子的组成成分等)。

如果你的咖啡的起始温度为华氏145度,那么随着时间的推移,你会观察到其温度降低的情况如下表所示:

你的咖啡的温度每分钟会降低5华氏度。如果你在两个观察点之间进行内插,比方说,你想知道两个测量时间点中间咖啡的温度,那么你的内插所得数值将会非常准确。

但如果你从上述温度模式中进行外推,那么你很有可能得到一个荒谬的结果,比如说30分钟后咖啡的温度将会降至冰点:

外推法没能考虑到这样一个物理学上的限制条件:咖啡的温度不可能降到室温以下。

同时,外推法还忽略了另外一个情况:当咖啡的温度降到与室温接近时,下降的速度就会减缓。

所以,咖啡冷却函数图形的其余部分应当是这样的:

请留意,图中前10分钟内的曲线坡度在10分钟之后没有继续保持 — — 曲线变得平直了。

这说明,当你使用外推法时,有两件事情非常重要:(1)必须要有大量的观察点;(2)必须具备关于所统计事件发生过程的一些知识

精确度和准确度不是一码事

看到数字具有精确度时,人们往往会认为它们也具备准确度。

但事实上,精确度和准确度并不是一回事。

如果我说“如今很多人都在购买电动汽车”,你会认为我只是在做猜测;但是如果我说“售出的新汽车中有16.39%是电动汽车”,你就想当然地认为我所说的是实际情况。

可是,你混淆了精确度和准确度。上述数据有可能是我编造的,也有可能是我在电动汽车4S店附近的少数人中抽取的狭隘的统计样本。

这也是媒体最常用的忽悠大法

回忆上篇文章中的例子:《时代周刊》的那个标题,即 “使用手机的人比用马桶的人还多”。

这种表述并非不合理,但却是对事实的一种扭曲,因为联合国的一项研究表明事实并非如此。

联合国的研究报告称,可以使用手机的人比可以使用马桶的人多。我们知道,这种表述完全是另外一回事。

几十个人可以共同使用同一部手机。尽管全球范围内卫生设施的缺乏仍然令人忧心,但该杂志的标题听上去让人觉得,假如你去统计数量,会发现世界上的手机数量比马桶还要多。然而,这种观点并没有数据的支撑。

当你在统计学中见到类似“可以使用到”这样的表述时,一定要提高警惕。

人们可以使用到医疗保健服务,不过这意味着这些人的居住地距离有医疗设施的地方比较近,并不是说这些医疗场所就一定会接纳他们,或者人们就一定能够负担得起医疗费用。

正如上文中解释的那样,尽管 CSPAN 公司的电视节目可以覆盖到1亿个家庭,但它并不能表明有1亿人在收看该公司的电视节目。

只要能够说明,世界总人口中有90%的人都可以使用互联网连接,那么我就可以宣称,全世界有90%的人都“可以阅读到”这篇文章。

比较截然不同的事物

用统计数据说谎的一种方式是对比不相同的事物,比如比较数据集、人口、产品类型等,并且假装它们是相同的。

曾经有一篇文章说,自由职业者比996还累(工时更高)。

这也许是事实,但是,自由职业和996之间没有可比性。就如自主勤奋和被剥削之间没有可比性。

当贝索斯成为第一首富的时候,亚马逊的员工在大街上排着长队领取政府救济的食品券,你不能因此说:“失业人士都不一定能领到食品券呢”,同样道理。虽然是事实。

再一次,媒体的宣传很喜欢采用这类谬误

比如采用较隐蔽的方法,你就可以宣称,战争时期(比如阿富汗战争)在部队服役要比待在美国本土舒适的家里更为安全。

这种说法的推理起点是:2010年,有3482名美国现役军事人员丧生。鉴于美国军队的总人数为1431000人,所以军队现役人员每1000人中就有2.4人牺牲;而2010年,全美国每1000人中死亡的人数为8.2

换言之,身处作战地区的军人的安全率是居住在美国本土的人的3倍多。

这是什么情况?所有数据都是真实可查的啊?因为,上述两个统计样本没有相似性,所以不能直接将其加以比较。

现役军人一般都是健康状况良好的年轻人。这些人的伙食很好,医疗条件也很好;而美国总人口却包括了老年人、病人、无家可归者、瘾君子、飞车党、掷刀游戏玩家(一种儿童技巧游戏,不能让掷出的刀子在地上呈竖立状态的玩家,即被罚以用牙齿拔地上的刀)……以及很多饮食和医疗条件都很差的穷人。

所以,无论身处何地,美国大众的死亡率都较高。美国军队现役人员并非全部都身处作战地区 — — 其中一些人待在非常安全的军事基地,或坐在五角大楼的办公室里,抑或驻扎在位于郊区零售商场的部队征兵处。

《美国新闻与世界报道》曾经刊载了一篇文章。该文比较了20世纪30年代美国全国范围内分别支持民主党和共和党的选民人数比例。

它的问题在于,统计抽样方法已经随着时间的流逝而发生了变化。

在20世纪三四十年代,人们采用的抽样方法是现场采访或信件邮递,而到了70年代则通过电话采访进行抽样调查。

20世纪早期的电话抽样结果偏向于那些拥有座机的人,即富裕阶层。至少在那个年代,富裕的选民倾向于投票支持共和党。

进入21世纪,手机成为抽样调查的途径。此时的抽样结果则偏向于那些选择支持民主党的年轻选民

无法确切地知道,20世纪30年代以来,支持民主党和共和党的选民人数的比例是否发生了变化。

原因在于,相关的统计样本相互之间存在矛盾之处。

人们普遍认为自己研究的是同一件事,但事实上却并非如此

在做统计结论之前,一定要当心样本方面的变化!

《美国新闻与世界报道》曾撰文写到,医生数量在12年里增加了,而同一时期医生的平均工资却显著下降了。

读者会从中获取什么信息呢?你或许会下结论说,由于医生人数太多,所以现在不是选择成为医生的好时机。

而且,由于医生人数大于社会需求,所以每个医生的薪水都下降了。

你的结论可能是正确的,但是,请注意,上述报道中并没有证据可以支撑这个结论。

⚠️有时,人们之所以会比较截然不同的事物,是因为它们来自不一致的次级样本,即人们忽略了一个自己尚没有认识到其重要性的细节。

例如,当从一块施用了新品种化肥的农田中抽取玉米样本时,你也许并没有注意到,一些玉米穗获得的日照更多,而另一些玉米穗吸收的水分更多。

再比如,在研究交通模式如何影响街道路面的重新铺设时,你可能没有意识到,某些街道表面的水流更多,从而影响了所需要的沥青数量。

统计样本的混合是指把不相同(不同种类)的事物全部放在同一处或归入同一类别 — — 对比截然不同事物的一种形式

如果你考察的是由同一家工厂生产的有缺陷齿轮的数量,那么你就有可能把两种完全不同的齿轮放在一起计数,从而使最终的统计数字满足你的特定目的。

再比如,你想把失业问题作为一个一般性的问题来探讨,那么就存在这样一种风险,即 把背景情况很不同的人和真正的失业者混杂到一起。

一些人身体上有残疾,所以无法参加工作;一些人由于在工作中偷窃或醉酒因而让雇主有正当理由将其解雇;有一些人想要工作却没有接受过相关培训;一些人在监狱服刑;还有一些人不打算再工作了,因为他们已经回到学校学习、或者靠家里养活自己。

当用统计数据来影响公共政策,或者为某事筹集善款,抑或营造社会舆论时,人们经常会忽视统计样本的细微差别,但正是这些细微的差别造成了完全不同的统计结果

一个报告表明,西班牙年轻人的失业率达到了令人惊诧的23%。该报告其实把一般来说应当出现在不同类别中的人混杂在了同一个样本之中了:它把没有找工作的学生也算作失业人员,同时还把刚被解雇的工人和正在找工作的工人也归入失业人员之列。

2015年7月,《今日美国》报道称,美国的失业率下降到了5.3%,“这是自2008年4月以来的最低值”。

综合性更强的新闻机构,包括美联社(AP)、《福布斯新闻》和《纽约时报》均报道了失业率明显下降的原因:很多失业的人放弃了寻找工作,所以从技术上来讲已经不能再将其视为工作人口了。[Schwartz, N. D. (2015). Jobless rate fell in June, with wages staying flat. New York Times, B1 (July 3, 2015)]

似是而非的样本类别细分

⚠️与样本类别混合相反的做法是样本类别细分,它也能诱使人们相信各种虚假的信息。

为了把X说成是导致Y出现的首要原因,只需要把其他原因细分为越来越小的类别,就可以了。

假设你在一家生产空气净化器的公司工作,你需要完成这样一项工作:证明在美国,呼吸道疾病是导致死亡的首要疾病,它排在心脏病和癌症之前。

事实上,截至今天,排在第一位的致死性疾病仍然是心脏病。

疾病控制与预防中心的数据是:本年度心脏病致死:611105例;癌症:584881例;慢性下呼吸道疾病:149205例。

现在,暂时不考虑家用空气净化器有可能无法显著地预防呼吸道疾病这样的细节性问题。

但是,从产品营销的角度来看,诸如你的公司“致力于预防致死率排在第三的疾病”之类的宣传说法,并不能给人留下深刻的印象。但是,等一下,心脏病并非只有一种,它有很多种:

  • 急性风湿热和慢性风湿性心脏病:3260例
  • 高血压性心脏病:37144例
  • 急性心肌梗死:116793例
  • 心力衰竭:65120例

像这样的心脏病种类还有很多。

下一步,把癌症也细分为更小的次级类别。通过不对样本种类进行混合,并且创造出这些非常好的细分类别,你就成功做到了 — — 慢性下呼吸道疾病现在俨然成了致死率最高的疾病。

现在你已经为自己赢得了一份奖金。

一些食品公司就采用了这种细分样本类别的策略,从而隐藏了其产品中脂肪和糖分的含量。

“假新闻”这个概念本身就是错误的,纯粹的*假*占据比例不会超过10%,而且不难识别;而如果你把注意力集中的“假”上,就会错过90%的隐性误导 —— 这90%才是真正难以被识别的。

能起到有效的忽悠作用的新闻完全可以是真实的,只需要使用一些巧妙的措辞和/或对数据呈现方式的小小调整。

这就是为什么要普及这些鉴别知识,尤其是关于“什么是证据” 的概念标准,只要能有更多人具备鉴定的直觉,假货就不会造成太过致命的结果。

顺便推荐一本书《How to Lie with Bad Data》这个链接您可以在线下载。

本系列的下一篇文章将介绍语言方面最为微妙的认知操纵,希望这些知识能对您有用。我们下次见。⚪️

One thought on “恶搞统计数据:小心媒体用统计忽悠人(3)

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据