拙作《我选出的价值中国网2008年综合实力十五强》在价值中国网发表后,引起了不少作者和网友的关注。总体上看,对笔者在文中提出的评价体系持赞成与支持态度的居多。当然,也有持怀疑态度的,任俊正先生大概算是其中之一。他在这篇文章的后面发了很长的一篇跟帖,可惜因为字数太多的原因,系统没有公开显示,而只在我的管理界面出现。所以,原打算以在线跟帖的方式作答的,只好又改成一篇文章,单独发表,供大家参考。
任俊正先生在跟帖中提出了四个问题:
1,将指标体系的战略思想重申。如果价值中国网搞活动,既提高不了专家群的数量,也提高不了质量,也提高不了新注册用户及固定读者群,有什么意义?价值中国网搞评选活动,其战略目的可能不是象政府评"五好家庭"一样,必然要为价值中国发展做出贡献。该指标体系是否有利于价值中国发展,可重申一下。
2,指标选择上,激励与约束如何平衡需重申。譬如,专栏文章数,能够激励更多人发文章,但是也可能出现滥发文章的,怎么约束;有效点击数,可能强调本人知名度,但也可能造成"枪手"现象;第四轮投票数,不都麻烦吗,王先生当时都很痛恨"马甲"现象.
激励约束不平衡,就会出现这次评选百强阶段的问题。譬如,发一篇地震消息的文章点击要比发一篇财务学术文章多,怎么评?再譬如发一篇针对价值中国网的文章点击自然高些,怎么防炒作与真实水平的混淆。从这个角度,王先生有必要说明自己的规则比价值中国定的规则更高明。
3,指标之间的关系。给出的A\B\C\D四个指标,D平均点击率是否等于A除以B,或大致相当,这个相关度高的指标是否多余?如果多余,那么王先生主张用文章数及有效点击量来评选,是否过于简单?指标之间可以有联系,但是相对独立应该是个原则。可以进一步解释?另外,为什么是四项简单求和,而不是加权求和?
4,参评起点规则制定方面可再细化,凭什么设置那种水平的门槛?规定100篇可参评,几万点可参评啦之类,也必须有个准确的依据。一是利于价值中国发展,二是利于参与面广些。如果仅仅有一点点人参加,譬如几百人参加,有多大意义?
任俊正先生提出的这四个问题,比较有代表性。所以我愿意一一地按照我的理解作些解释和说明。
第一,关于指标体系的战略思想问题。我提出的这个体系只是我个人的研究成果,推出的时候并没有明确的战略思想。但这并不意味着体系中没有隐含着潜在的战略思想。任何一个指标体系,除了可操作性之外,最重要的特性有两个,一是客观性,能够客观地反映被评价事物的主要特征;二是导向性,能够通过指标体系的应用对相关地区、部门、单位或个人产生很好的导向作用,引领大家向正确的方向前进。由是观之,价值中国最有影响力的专家评选指标体系,就必须兼顾文章数量与质量的统一、作者与读者的统一、主业与副业的统一。也就是说,一个好的指标体系,必须既有数量的考核,又有质量的考核;既有对作者本身的考核,又有对读者反响的考核;既有对专栏文章写作的考核,又有对日志、百科、书评、见解、新闻解读、以及投票留言之类的考核。而这样的体系,一方面契合了网站的实际,另一方面也会产生很好的导向作用,即引导作者们兼顾上述三方面的统一。道理很简单,哪些指标纳入考核,哪些内容就更会受到作者的关注。其集聚效应会比较明显。
第二,关于指标的设置问题。这实际上是任先生所提出的第三个问题,我认为先回答这一个更有利于对第二个问题的理解和把握。这个体系包括A、B、C、D四个指标,即专栏文章数量、全部文章的有效点击量、第四轮获得投票的数量、原创文章平均点击率。这些指标是反映作者影响力的一个有机体,因此相互之间肯定是有联系的,比如,专栏文章的数量,会影响全部文章的有效点击量,同时也会影响原创文章的平均点击率,而投票的数量也会受到另外三个因素的影响。但是,这四个指标又是相互独立的,没有重复的成份。专栏文章数量是特指发表在价值中国“专栏文章”中的文章数量,这是一个总量指标;全部文章的有效点击量则是指作者在价值中国网上发表的各类作品(包括专栏文章,也包括上面提到的日志、书评等等)被读者的有效点击量,也是一个总量指标;第四轮获得投票的数量,是指进入第四轮评比后所获得的读者投票数量,这也是一个总量指标;原创文章平均点击率,是指专栏文章中原创文章的平均点击数,这是一个平均指标,也是一个质量指标。所以,D的分母是专栏文章中原创文章的数量,而不是A,分子是这些原创文章的总点击量,而不是B,与A和B反映的是不同的内容,是相对独立的,并不多余。因此,也不能把这四个指标简化为文章数及有效点击量,不存在简单的问题。至于为什么是四项简单求和,而不是加权求和?那是因为事实上等于赋予了这四项相同的权重,因而省略加权求和,区别只在于每个人分值的等比例放大或缩小,对排名的结果是没有任何影响的。
第三,关于指标选择的激励与约束平衡问题。在搞清楚第二个问题之后,这个问题就容易理解了。A、B、C、D四个指标都是激励指标,因为指标值越大,就意味着作者排名越靠前。但是,由于各指标之间是有内在联系的,所以D这个质量指标同时也是具有约束与牵制作用的。即专栏文章如果增多,则意味着原创文章会随之增多,其结果是导致D指标的分母变大,从而影响D指标值的升高。这在客观上对滥发文章的就会起到约束作用,除非当事人并不看重评比。有效点击数,能够反映作者的知名度,虽然有可能造成"枪手"现象,但“有效”意味着同一IP的多次点击只计一次,所以实际上已经对“枪手”的作用作了限制。至于第四轮投票数量,确实会有“拉票”、“马甲”现象的存在,但由于有价值中国网比较严格的注册规定和限制投票量的措施,应该也是能够反映作者的实际影响力的。我不认为“拉票”者就应该被贬低,“拉票”也是影响力,票是拉来的而不是抢来的,你要有本事才能拉得到。那些不屑于拉票的人也不必清高,如果自己有充分的自信,那就不应该计较他人的拉票行为。因为规则并没有禁止拉票。
不同属性的文章(比如地震类与财务类)、不同属性的作者,当然分开评是最好的,就象央视青歌赛分美声、通俗、民歌、原生态组一样,但在条件不允许的情况下,只能用抽象的两把尺子即文章数量和点击率来衡量。尺子一样,对大家也是相对公平的。既然想参加评比,那就必须考虑读者的接受,必须主动去适应读者的需求,而不是单纯的卖方市场。何况,如果觉得靠质量影响不了读者的话,那还可以通过增加数量来进行另一种形式的争夺嘛。至于怎么防炒作与真实水平的混淆问题,我认为从较长的时间跨度看是不存在这个问题的。炒作只能偶尔为之,经常如此是会败坏自己的名声的,而名声一旦坏了,就会象“狼来了”那个故事中的牧羊少年一样,再也没有人相信他的炒作了。我从来没有说自己的规则比价值中国定的规则更高明,如果非要进行比较的话,我只能说价值中国现行规则各个轮次是有重复使用的成份在的,而且对均值看得过重,没有很好地解决数量与质量的关系问题,存在着一个人的满分投票均分胜过多人的投票均分、几篇文章的平均点击胜过多篇文章的平均点击的尴尬现象。
第四,关于参评起点问题。一个好的指标体系是应该有标准值的。对于最有影响力的专家评比而言,尤其需要标准值和准入门坎。因为我们是在评最有影响力的出类拔萃的专家,而不是为价值中国的每个作者打分。设定这样的门坎,主要不是为了难为谁,而是为了减少不必要的工作量。试想,一个每项指标都排在五百强之后的作者,他可能还有实力参与百强的竞争吗?门坎实际上相当于预选赛。门坎可以是位次,比如百强;也可以是具体指标,比如百篇。其结果都是一样的,入不了围的无论如何也入不了围。至于为什么规定百强而不是千强,为什么规定百篇而不是十篇?那倒不是什么原则性问题,完全根据需要评出的人数来定。另外,设定门坎还有一个好处便是确保当选者的均衡发展和整体实力,不至于出现畸高畸低、以高拉低的情况。需要说明的是,这样的评选是建立在价值中国对每个作者的日常考核基础上的,看起来因为门坎的限制参与人员较少,实际上却是涉及每个人的评比工作,参与面非常之广。最终能够获奖的可能仅仅有一点点人,但实际参加的却是所有人。因为那些没有机会跨进门坎的,也是有自己的相关数据的。只不过,他们的数据还不足以让他们跨越门坎而已。
任俊正先生在跟帖中提出了四个问题:
1,将指标体系的战略思想重申。如果价值中国网搞活动,既提高不了专家群的数量,也提高不了质量,也提高不了新注册用户及固定读者群,有什么意义?价值中国网搞评选活动,其战略目的可能不是象政府评"五好家庭"一样,必然要为价值中国发展做出贡献。该指标体系是否有利于价值中国发展,可重申一下。
2,指标选择上,激励与约束如何平衡需重申。譬如,专栏文章数,能够激励更多人发文章,但是也可能出现滥发文章的,怎么约束;有效点击数,可能强调本人知名度,但也可能造成"枪手"现象;第四轮投票数,不都麻烦吗,王先生当时都很痛恨"马甲"现象.
激励约束不平衡,就会出现这次评选百强阶段的问题。譬如,发一篇地震消息的文章点击要比发一篇财务学术文章多,怎么评?再譬如发一篇针对价值中国网的文章点击自然高些,怎么防炒作与真实水平的混淆。从这个角度,王先生有必要说明自己的规则比价值中国定的规则更高明。
3,指标之间的关系。给出的A\B\C\D四个指标,D平均点击率是否等于A除以B,或大致相当,这个相关度高的指标是否多余?如果多余,那么王先生主张用文章数及有效点击量来评选,是否过于简单?指标之间可以有联系,但是相对独立应该是个原则。可以进一步解释?另外,为什么是四项简单求和,而不是加权求和?
4,参评起点规则制定方面可再细化,凭什么设置那种水平的门槛?规定100篇可参评,几万点可参评啦之类,也必须有个准确的依据。一是利于价值中国发展,二是利于参与面广些。如果仅仅有一点点人参加,譬如几百人参加,有多大意义?
任俊正先生提出的这四个问题,比较有代表性。所以我愿意一一地按照我的理解作些解释和说明。
第一,关于指标体系的战略思想问题。我提出的这个体系只是我个人的研究成果,推出的时候并没有明确的战略思想。但这并不意味着体系中没有隐含着潜在的战略思想。任何一个指标体系,除了可操作性之外,最重要的特性有两个,一是客观性,能够客观地反映被评价事物的主要特征;二是导向性,能够通过指标体系的应用对相关地区、部门、单位或个人产生很好的导向作用,引领大家向正确的方向前进。由是观之,价值中国最有影响力的专家评选指标体系,就必须兼顾文章数量与质量的统一、作者与读者的统一、主业与副业的统一。也就是说,一个好的指标体系,必须既有数量的考核,又有质量的考核;既有对作者本身的考核,又有对读者反响的考核;既有对专栏文章写作的考核,又有对日志、百科、书评、见解、新闻解读、以及投票留言之类的考核。而这样的体系,一方面契合了网站的实际,另一方面也会产生很好的导向作用,即引导作者们兼顾上述三方面的统一。道理很简单,哪些指标纳入考核,哪些内容就更会受到作者的关注。其集聚效应会比较明显。
第二,关于指标的设置问题。这实际上是任先生所提出的第三个问题,我认为先回答这一个更有利于对第二个问题的理解和把握。这个体系包括A、B、C、D四个指标,即专栏文章数量、全部文章的有效点击量、第四轮获得投票的数量、原创文章平均点击率。这些指标是反映作者影响力的一个有机体,因此相互之间肯定是有联系的,比如,专栏文章的数量,会影响全部文章的有效点击量,同时也会影响原创文章的平均点击率,而投票的数量也会受到另外三个因素的影响。但是,这四个指标又是相互独立的,没有重复的成份。专栏文章数量是特指发表在价值中国“专栏文章”中的文章数量,这是一个总量指标;全部文章的有效点击量则是指作者在价值中国网上发表的各类作品(包括专栏文章,也包括上面提到的日志、书评等等)被读者的有效点击量,也是一个总量指标;第四轮获得投票的数量,是指进入第四轮评比后所获得的读者投票数量,这也是一个总量指标;原创文章平均点击率,是指专栏文章中原创文章的平均点击数,这是一个平均指标,也是一个质量指标。所以,D的分母是专栏文章中原创文章的数量,而不是A,分子是这些原创文章的总点击量,而不是B,与A和B反映的是不同的内容,是相对独立的,并不多余。因此,也不能把这四个指标简化为文章数及有效点击量,不存在简单的问题。至于为什么是四项简单求和,而不是加权求和?那是因为事实上等于赋予了这四项相同的权重,因而省略加权求和,区别只在于每个人分值的等比例放大或缩小,对排名的结果是没有任何影响的。
第三,关于指标选择的激励与约束平衡问题。在搞清楚第二个问题之后,这个问题就容易理解了。A、B、C、D四个指标都是激励指标,因为指标值越大,就意味着作者排名越靠前。但是,由于各指标之间是有内在联系的,所以D这个质量指标同时也是具有约束与牵制作用的。即专栏文章如果增多,则意味着原创文章会随之增多,其结果是导致D指标的分母变大,从而影响D指标值的升高。这在客观上对滥发文章的就会起到约束作用,除非当事人并不看重评比。有效点击数,能够反映作者的知名度,虽然有可能造成"枪手"现象,但“有效”意味着同一IP的多次点击只计一次,所以实际上已经对“枪手”的作用作了限制。至于第四轮投票数量,确实会有“拉票”、“马甲”现象的存在,但由于有价值中国网比较严格的注册规定和限制投票量的措施,应该也是能够反映作者的实际影响力的。我不认为“拉票”者就应该被贬低,“拉票”也是影响力,票是拉来的而不是抢来的,你要有本事才能拉得到。那些不屑于拉票的人也不必清高,如果自己有充分的自信,那就不应该计较他人的拉票行为。因为规则并没有禁止拉票。
不同属性的文章(比如地震类与财务类)、不同属性的作者,当然分开评是最好的,就象央视青歌赛分美声、通俗、民歌、原生态组一样,但在条件不允许的情况下,只能用抽象的两把尺子即文章数量和点击率来衡量。尺子一样,对大家也是相对公平的。既然想参加评比,那就必须考虑读者的接受,必须主动去适应读者的需求,而不是单纯的卖方市场。何况,如果觉得靠质量影响不了读者的话,那还可以通过增加数量来进行另一种形式的争夺嘛。至于怎么防炒作与真实水平的混淆问题,我认为从较长的时间跨度看是不存在这个问题的。炒作只能偶尔为之,经常如此是会败坏自己的名声的,而名声一旦坏了,就会象“狼来了”那个故事中的牧羊少年一样,再也没有人相信他的炒作了。我从来没有说自己的规则比价值中国定的规则更高明,如果非要进行比较的话,我只能说价值中国现行规则各个轮次是有重复使用的成份在的,而且对均值看得过重,没有很好地解决数量与质量的关系问题,存在着一个人的满分投票均分胜过多人的投票均分、几篇文章的平均点击胜过多篇文章的平均点击的尴尬现象。
第四,关于参评起点问题。一个好的指标体系是应该有标准值的。对于最有影响力的专家评比而言,尤其需要标准值和准入门坎。因为我们是在评最有影响力的出类拔萃的专家,而不是为价值中国的每个作者打分。设定这样的门坎,主要不是为了难为谁,而是为了减少不必要的工作量。试想,一个每项指标都排在五百强之后的作者,他可能还有实力参与百强的竞争吗?门坎实际上相当于预选赛。门坎可以是位次,比如百强;也可以是具体指标,比如百篇。其结果都是一样的,入不了围的无论如何也入不了围。至于为什么规定百强而不是千强,为什么规定百篇而不是十篇?那倒不是什么原则性问题,完全根据需要评出的人数来定。另外,设定门坎还有一个好处便是确保当选者的均衡发展和整体实力,不至于出现畸高畸低、以高拉低的情况。需要说明的是,这样的评选是建立在价值中国对每个作者的日常考核基础上的,看起来因为门坎的限制参与人员较少,实际上却是涉及每个人的评比工作,参与面非常之广。最终能够获奖的可能仅仅有一点点人,但实际参加的却是所有人。因为那些没有机会跨进门坎的,也是有自己的相关数据的。只不过,他们的数据还不足以让他们跨越门坎而已。