真实的数据也会骗人

统计学是一门和数字打交道的学问,但它往往不像基础数学那样,答案非黑即白,逼近真理。在别有用心的人眼里,统计学就是数字的魔术,「我保证我说的每个字都是真实的,但结果却和真实世界大大背离」。

 

最近因为网易的一篇文章,大家关于中国的电费到底贵不贵这个问题,在网上吵得不可开交。

 

网易新闻的编辑用每月人均用电1000度的价格,除以了2011年每月人均可支配收入,得到了各国人民的用电负担,然后得出结论是「中国居民电费负担全球最高」。

 

真实的数据也会骗人

 

这其实是一个比较鸡贼的观点,因为大部分读者都是用电的人,而非电力部门的职工,谁不希望电价能更便宜些呢?

 

只要中国的电费不是零,大家都会希望电价能降低。可是,空喊降低电费好像有点单薄,如果有数据支撑,通过客观比较,说明我国的电价比其他国家贵,那就好了。

 

网易的编辑就是迎合了这种想法,而且理直气壮,毕竟数据来源是国际能源署和OECD(经济合作与发展组织),都是这么权威的机构,谁敢质疑数据呢?

 

但问题是,真实的数据可以选择性处理,就像真实的事件可以选择性报道,截取出部分的事实,可以得到完全扭曲的结论。

 

针对网易这个结论,我们可以提出几个问题:

 

1.中国人均电费占可支配收入的28%的结论听起来就很多了,但是每月人均用电1000度是怎么算出来的?如果按居民用电计算,中国人均每月用电在60度左右,和1000度差了16倍,凭什么按1000度计算电费负担呢?

 

唯一可能的解释就是,如果按真实的人均用电量计算,2011年我国的人均电费占可支配收入才不到1.7%,想得出中国人电费负担太大了的结论,这怎么也说不过去。

 

2.为什么2019年的统计分析,要采用2011年的数据?各国用电、发电量都是按季度公布数据的,再怎么也不至于拿不到2018年的数据吧?

 

这个问题上的处理,网易的编辑就显得更鸡贼了,我国从2012年开始实施阶梯式电价,也就是用电越少,电费越低,这是为了给低用电量的家庭一些补贴,也间接提醒大家节约用电。

 

所以,从2012年起,我国人均用电负担是明显下降的,而网易却选择了2011年的数据来计算,可见是“为了黑而黑”的典范呀。

 

真实的数据也会骗人

 

其他国家的数据没受到年份影响,是因为自从上个世纪70年代的石油危机之后,日本、韩国、美国等国家,就已经采用了阶梯式定价计算电费。

 

3.最后,这份「中国居民电费负担全球最高」的图表,真的是中国和全球各国的数据对比吗?

 

其实不是,图上显示了二十多个发达国家,却对印度、老挝、越南这些国家避而不谈,完全是误导性的陈述。如果把全球所有国家拿出来对比,别说是中国排第一了,可能我们连这张二十个国家的排行榜都上不了。

 

网易的数据研究变成“谣言”已经不是第一次了,在前段时间的文章中,网易还提出过另一个更令人震惊的结论,「80%的新增财富落入了全球1%的最富裕人口的口袋中」。

 

这个说法一出来,仇富的人更加仇富了,原本不仇富的人也会在心里焦虑一下,原来社会的新增财富都原本就有钱的人赚走了,那不是代表阶级固化更严重了,我哪里还有机会成功呀?

 

无数贩卖焦虑的文章也引用了网易的这个结论,大谈普通人的赚钱危机。但是,你可能光顾着焦虑去了,没有想过这个结论背后的蹊跷。

 

什么叫社会新增财富呢?

 

我们用一个富人代表最富人阶级,假设他在经济下行时亏掉了20元,又在经济复苏时赚到了90元。

 

再用10名普通人代表一般阶级,假设他们每个人在经济下行时亏了5元,又在经济复苏时赚了10元。

 

那么社会的新增财富,就是:-20+90-5x10+10x10=120元。

 

那么富人阶级赚的钱占社会新增财富的多少呢?答案是90/120=75%。

 

这个比例很高了,那一般阶级呢?答案是100/120=83.3%。

 

算到这里你可能觉得很搞笑了,怎么这两个比例加起来超过了100%?而且一般阶级的占比居然比富人阶级还要高?

 

原因就是,这个算法根本没有意义。赚的钱≠净利润,因为人可以赚钱也可以亏钱,而新增财富也是,只要不注明是净新增财富,那么新增财富里就有负数也有正数。

 

虽然每个数据都是真的,但是这个除号上下的数字可能根本没有比较的意义,结论也就令人啼笑皆非了。

 

虽然数据和计算结果都是正确的,但却会产生严重的误导性,我们可以称这种为「误导性事实」。

什么叫误导性事实呢,比如说,我们之前看到水滴筹上一些人贴出自己重病的资料,看起来楚楚可怜,让人忍不住想要伸出援手。但是,很快他们又被曝光家里有房有车,可能比你资产还多,很明显,我们这时候可以认定这些人是骗子。

 

但他们贴出的病历不是真的吗?他们描述自己可怜的情况不也是真的吗?

 

在「选择性报道」的剪辑之下,我们得出的结论可能是颠倒黑白的,只陈述一部分事实,就能让衣食无忧的有钱人,变成需要社会援助的可怜人。

 

我们再看下面这幅壁画,如果我们只截取红圈的部分,很容易就会以为是前面的人想要刺杀后面的人,可是如果看到完整的图画,却变成了后面的人在追杀前面的人,因为视角的转换,两人的关系竟然完全颠倒了。

 

 

在面对社会新闻类的误导性事实时,我们一般还能看出来端倪,但是在面对数据时,我们往往会被偷换概念的分析人员所迷惑,甚至会被耍得团团转。

 

统计学的魔法并不难破除,想要看清楚谁在骗你,多多了解统计原理就能自己判断,再结合我们的真实生活经验,那些贩卖恐慌和焦虑的谎言,就会不攻自破。

 

数字之间算来算去只是统计,搞清楚计算的意义,才是科学。

 

今天玩统计学魔术的人,和过去玩文字游戏、选择性报道的人没有区别,也许一时之间他们能吸引眼球,获得流量,但是长远来看,损害的是自己的公信力,浪费的是社会公众的时间和感情。

 

真实的数据也会骗人,说到底还是无良媒体在制造麻烦,如今看个新闻也有智力筛选,真是不保持学习都不行了呢。有自己的判断能力,远离误导性报道的媒体,我们才能更清晰地看到这个世界,更明白自己的定位和方向,这也是持续学习的一种意义吧。

发表评论

电子邮件地址不会被公开。 必填项已用*标注

上一篇:

下一篇: