关于价值中国专家评价体系的问与答

　　拙作《我选出的价值中国网2008年综合实力十五强》在价值中国网发表后，引起了不少作者和网友的关注。总体上看，对笔者在文中提出的评价体系持赞成与支持态度的居多。当然，也有持怀疑态度的，任俊正先生大概算是其中之一。他在这篇文章的后面发了很长的一篇跟帖，可惜因为字数太多的原因，系统没有公开显示，而只在我的管理界面出现。所以，原打算以在线跟帖的方式作答的，只好又改成一篇文章，单独发表，供大家参考。

　　任俊正先生在跟帖中提出了四个问题:

　　1,将指标体系的战略思想重申。如果价值中国网搞活动，既提高不了专家群的数量，也提高不了质量，也提高不了新注册用户及固定读者群，有什么意义？价值中国网搞评选活动,其战略目的可能不是象政府评"五好家庭"一样,必然要为价值中国发展做出贡献。该指标体系是否有利于价值中国发展,可重申一下。

　　2,指标选择上,激励与约束如何平衡需重申。譬如,专栏文章数,能够激励更多人发文章,但是也可能出现滥发文章的，怎么约束；有效点击数,可能强调本人知名度,但也可能造成"枪手"现象；第四轮投票数,不都麻烦吗，王先生当时都很痛恨"马甲"现象.

　　激励约束不平衡,就会出现这次评选百强阶段的问题。譬如，发一篇地震消息的文章点击要比发一篇财务学术文章多，怎么评？再譬如发一篇针对价值中国网的文章点击自然高些，怎么防炒作与真实水平的混淆。从这个角度,王先生有必要说明自己的规则比价值中国定的规则更高明。

　　3,指标之间的关系。给出的A\B\C\D四个指标，Ｄ平均点击率是否等于Ａ除以Ｂ，或大致相当，这个相关度高的指标是否多余？如果多余，那么王先生主张用文章数及有效点击量来评选，是否过于简单？指标之间可以有联系，但是相对独立应该是个原则。可以进一步解释？另外，为什么是四项简单求和，而不是加权求和？

　　4,参评起点规则制定方面可再细化，凭什么设置那种水平的门槛？规定１００篇可参评，几万点可参评啦之类，也必须有个准确的依据。一是利于价值中国发展，二是利于参与面广些。如果仅仅有一点点人参加，譬如几百人参加，有多大意义？

　　任俊正先生提出的这四个问题，比较有代表性。所以我愿意一一地按照我的理解作些解释和说明。

　　第一，关于指标体系的战略思想问题。我提出的这个体系只是我个人的研究成果，推出的时候并没有明确的战略思想。但这并不意味着体系中没有隐含着潜在的战略思想。任何一个指标体系，除了可操作性之外，最重要的特性有两个，一是客观性，能够客观地反映被评价事物的主要特征；二是导向性，能够通过指标体系的应用对相关地区、部门、单位或个人产生很好的导向作用，引领大家向正确的方向前进。由是观之，价值中国最有影响力的专家评选指标体系，就必须兼顾文章数量与质量的统一、作者与读者的统一、主业与副业的统一。也就是说，一个好的指标体系，必须既有数量的考核，又有质量的考核；既有对作者本身的考核，又有对读者反响的考核；既有对专栏文章写作的考核，又有对日志、百科、书评、见解、新闻解读、以及投票留言之类的考核。而这样的体系，一方面契合了网站的实际，另一方面也会产生很好的导向作用，即引导作者们兼顾上述三方面的统一。道理很简单，哪些指标纳入考核，哪些内容就更会受到作者的关注。其集聚效应会比较明显。

　　第二，关于指标的设置问题。这实际上是任先生所提出的第三个问题，我认为先回答这一个更有利于对第二个问题的理解和把握。这个体系包括A、B、C、D四个指标，即专栏文章数量、全部文章的有效点击量、第四轮获得投票的数量、原创文章平均点击率。这些指标是反映作者影响力的一个有机体，因此相互之间肯定是有联系的，比如，专栏文章的数量，会影响全部文章的有效点击量，同时也会影响原创文章的平均点击率，而投票的数量也会受到另外三个因素的影响。但是，这四个指标又是相互独立的，没有重复的成份。专栏文章数量是特指发表在价值中国“专栏文章”中的文章数量，这是一个总量指标；全部文章的有效点击量则是指作者在价值中国网上发表的各类作品（包括专栏文章，也包括上面提到的日志、书评等等）被读者的有效点击量，也是一个总量指标；第四轮获得投票的数量，是指进入第四轮评比后所获得的读者投票数量，这也是一个总量指标；原创文章平均点击率，是指专栏文章中原创文章的平均点击数，这是一个平均指标，也是一个质量指标。所以，Ｄ的分母是专栏文章中原创文章的数量，而不是A，分子是这些原创文章的总点击量，而不是Ｂ，与A和B反映的是不同的内容，是相对独立的，并不多余。因此，也不能把这四个指标简化为文章数及有效点击量，不存在简单的问题。至于为什么是四项简单求和，而不是加权求和？那是因为事实上等于赋予了这四项相同的权重，因而省略加权求和，区别只在于每个人分值的等比例放大或缩小，对排名的结果是没有任何影响的。

　　第三，关于指标选择的激励与约束平衡问题。在搞清楚第二个问题之后，这个问题就容易理解了。A、B、C、D四个指标都是激励指标，因为指标值越大，就意味着作者排名越靠前。但是，由于各指标之间是有内在联系的，所以D这个质量指标同时也是具有约束与牵制作用的。即专栏文章如果增多，则意味着原创文章会随之增多，其结果是导致D指标的分母变大，从而影响D指标值的升高。这在客观上对滥发文章的就会起到约束作用，除非当事人并不看重评比。有效点击数,能够反映作者的知名度,虽然有可能造成"枪手"现象，但“有效”意味着同一IP的多次点击只计一次，所以实际上已经对“枪手”的作用作了限制。至于第四轮投票数量,确实会有“拉票”、“马甲”现象的存在，但由于有价值中国网比较严格的注册规定和限制投票量的措施，应该也是能够反映作者的实际影响力的。我不认为“拉票”者就应该被贬低，“拉票”也是影响力，票是拉来的而不是抢来的，你要有本事才能拉得到。那些不屑于拉票的人也不必清高，如果自己有充分的自信，那就不应该计较他人的拉票行为。因为规则并没有禁止拉票。

　　不同属性的文章（比如地震类与财务类）、不同属性的作者，当然分开评是最好的，就象央视青歌赛分美声、通俗、民歌、原生态组一样，但在条件不允许的情况下，只能用抽象的两把尺子即文章数量和点击率来衡量。尺子一样，对大家也是相对公平的。既然想参加评比，那就必须考虑读者的接受，必须主动去适应读者的需求，而不是单纯的卖方市场。何况，如果觉得靠质量影响不了读者的话，那还可以通过增加数量来进行另一种形式的争夺嘛。至于怎么防炒作与真实水平的混淆问题，我认为从较长的时间跨度看是不存在这个问题的。炒作只能偶尔为之，经常如此是会败坏自己的名声的，而名声一旦坏了，就会象“狼来了”那个故事中的牧羊少年一样，再也没有人相信他的炒作了。我从来没有说自己的规则比价值中国定的规则更高明，如果非要进行比较的话，我只能说价值中国现行规则各个轮次是有重复使用的成份在的，而且对均值看得过重，没有很好地解决数量与质量的关系问题，存在着一个人的满分投票均分胜过多人的投票均分、几篇文章的平均点击胜过多篇文章的平均点击的尴尬现象。

　　第四,关于参评起点问题。一个好的指标体系是应该有标准值的。对于最有影响力的专家评比而言，尤其需要标准值和准入门坎。因为我们是在评最有影响力的出类拔萃的专家，而不是为价值中国的每个作者打分。设定这样的门坎，主要不是为了难为谁，而是为了减少不必要的工作量。试想，一个每项指标都排在五百强之后的作者，他可能还有实力参与百强的竞争吗？门坎实际上相当于预选赛。门坎可以是位次，比如百强；也可以是具体指标，比如百篇。其结果都是一样的，入不了围的无论如何也入不了围。至于为什么规定百强而不是千强，为什么规定百篇而不是十篇？那倒不是什么原则性问题，完全根据需要评出的人数来定。另外，设定门坎还有一个好处便是确保当选者的均衡发展和整体实力，不至于出现畸高畸低、以高拉低的情况。需要说明的是，这样的评选是建立在价值中国对每个作者的日常考核基础上的，看起来因为门坎的限制参与人员较少，实际上却是涉及每个人的评比工作，参与面非常之广。最终能够获奖的可能仅仅有一点点人，但实际参加的却是所有人。因为那些没有机会跨进门坎的，也是有自己的相关数据的。只不过，他们的数据还不足以让他们跨越门坎而已。

价值中国

新知识 - 新思想 - 新经济实名制-专业主义-权益激励

关于价值中国专家评价体系的问与答

您还没有登录，请您登录后发表评论。