关于数据统计那点事

in #cn6 years ago

统计局.jpg
统计局2.jpg
6月27日,国家统计局发布数据显示,1-5月份,全国规模以上工业企业实现利润总额27298.3亿元,同比增长16.5%。

然而,有搞事的网友查了一下2017年同期的数据统计,去年此时,即2017年6月27日,国家统计局发布的数据显示,2017年1-5月份,全国规模以上工业企业实现利润总额为29047.6亿元。两则数据简单对比,相关网友得出了一个结果,2018年该项数据同比下降1749.3亿元,下降幅度6%,而非国家统计局发布的增长16.5%。该计算结果在微博上发布之后,引发网友围观,不少网友对国家统计局的数据提出疑问。

在回应中,国家统计局首先指出,“这一数据是真实可靠、实际可比的”。为什么不是下滑6%,而是增长16.5%?国家统计局解释说,“主要原因在于企业调查范围变化、剔除重复计算和非工业生产经营活动剥离。”简言之,2018年的统计数据中对不符合规模以上工业统计要求的企业进行了剔除,2017年和2018年统计样本中的企业数量发生了变化。
timg.jpg

就是说,统计规则发生变化了,基数变化了,增长16.5%已经不是去年利润总额29047.6亿元的基础了。。。

个人觉得,国内很多数据的统计,可能不会有太多参考价值,就像每年的CPI统计一样,统计结果还没出来,我们就都知道是2%了,也就是说,很多数据统计并不是实际统计出来是多少就多少,而是你需要它统计出来是多少的问题。就比如公司领导给你个任务,让你去统计项目的利润,你统计出来了,交给领导一看,领导说,“这么低,拿出来都不好看,这怎么行,你再核对一下看看是不是哪里算错了”。你拿回去看了一下,把一些乱七八糟可以放进去也可以不放进去的成本划出来了,发现利润唰的一下就上去了,完美,可以交差了!

u=2194386759,1674229234&fm=27&gp=0.jpg
数据统计上,有一个很普遍的现象,很多时候你看到的统计结果,其实在还没统计之前已经有了结果,然后再根据我们需要的统计结果,来寻找支持的统计方法和统计依据,采取跟之前统计一样的方法,最后结果“不好看”,那我们就换个方法统计,最后跟我们需要公布的结论差不多才行。

Coin Marketplace

STEEM 0.20
TRX 0.14
JST 0.030
BTC 66937.04
ETH 3270.78
USDT 1.00
SBD 2.74