所谓“平均数”,简单地说,就是N个样本值的总和除以样本数N得出的。其实,单一的“平均数”所能够反映的信息极为有限,因此在计算平均数之时,往往应同时计算“方差”或“离差”,也就是要计算各个样本与平均数偏离的水平。不知为什么,我们公布平均水平之时,从不公布离差水平。说白了,我们只知道平均工资,却不知道高工资群体的收入水平有多高、低工资群体的收入水平有多低、也不知道高低水平之间相差多少倍。
同样的道理,全社会计算平均收入,那么各种行业之间的收入差距,就被掩盖了;各地区之间的差距也被掩盖了;一般社会成员与既得利益成员间的差距,也被掩盖了。
依然是这一道理,全社会所有消费品计算平均价格指数,但实际上某些消费品是中低收入者从不消费的,所以由此计算出来的CPI与中低收入者的感受就会不同。统计官员往往会指责民众认识的偏差,笔者认为是统计部门的不当——理应给出不同收入群体的CPI,才能与民众的实际感受相符。
还有一个问题,“人均水平”也是容易忽悠人的指标。比如,人均公路里程,但真正受益于这些公路的却不是所有的百姓、而只是其中不大比例的群体。与此相类似的统计指标,还有很多。
另外一个问题,“平均数”,是通过 N个抽样样本得出来的,如果样本构成不合理,样本中多几个高收入的数据,那么我们的“平均收入水平”就会高出一截;反之,样本中多几个低收入的数据,那么我们的“平均收入水平”就会降低一截。这就使得,希望得到好看一些数据的部门,有“调控”的可能。
总之,“平均水平”对于喜好比较排位的人们或许大有用处,但对于认识和分析问题本质的作用并不大。所以,笔者在此呼吁,一、统计部门在计算公布“平均水平”的同时,也应计算和公布它的离差水平(如,垄断行业收入与全社会平均收入的离差、农民工收入与城镇职工收入水平的离差);二、统计部门在计算公布总体指标的同时,也应计算和公布分类的指标(如,低收入群体消费者价格指数);二、统计部门在计算公布人均指标时,应尽可能把与该事物无关的人群排除出去再计算(如,卫生事业投入,大部分用于城镇,农民受益很少,但计算人均卫生事业费时可能把他们也计算在内了)。