首页 »

观点|学术评价如何力避“爱有差等”

2019/9/11 17:06:20

观点|学术评价如何力避“爱有差等”

每一次学术评奖,都会引起各种热议。评奖的背后是评价,折射一种学术评价体系的制度、标准和偏好。“爱有差等”,乃人之常情;“文人相轻”,即使如今天之学者恐也不能都免其俗。从评价心理的角度看,这给以同行评议为基础的社会科学学术评价带来了现实的困难。如何破解这一难题,有学者认为应该主要依靠提高科研工作者的道德水平,这当然是对的。但许多历史经验教训都表明,把希望寄托在“人性本善”,而不从机制设计的角度着手,是不能从根本上解决问题的。在笔者看来,信息化提供了我们建设更加科学、更加全面的学术评价机制的强大物质手段。

 

依据统计学原理,在保持其它条件不变的前提下,样本过少会明显增加出现较大误差的可能性。在传统的科研评价机制下,由个位数甚至一两位权威学者对一项科研成果或人才进行评价,上述评价心理误区效应对评价结果的影响就可能会非常大。况且,中国社会传统上是人情社会,学者之间在这种密如蛛网的人际关系罗网中也未必都能做到“君子之交淡如水”。但如果我们能对单项科研成果或人才的评价者的数量增加到30人甚至100人以上,则应能大幅度提高评价的信度和效度。因为,一方面,从统计学的角度看,这能大幅度降低学术评价过程中的各种系统性和非系统性误差。另一方面,从社会心理学的角度看,一位学者恐怕很难与超过30位的同行都保持超过工作关系之外的密切私人联系,因此增加评价者人数能降低人情世故等非学术因素对学术评价的影响。

 

不过,在传统技术条件下,增加对单项科研成果或人才的评价者人数会提高成本,并出现许多其他实际困难。但信息化却对这一问题的解决带来了契机,笔者建议,由教育部或社科院牵头,建立全国统一的社会科学学术评价信息化平台(以一个网站或若干个网站所组成的网站群为载体),并根据一、二级学科的划分分别建立分平台,所有的学术评价都逐步转移到该平台上进行。高校教师、科研人员乃至高年级的博士研究生都同时作为评价者和被评价者加入相应学科的平台,这既有益于发挥学术民主,鼓励学术创新,也可防止学术垄断和近亲繁殖。从某种角度看,也体现出了真正的学术共同体精神,在其中,每个社科工作者进行自身的学术创新和对他人的学术评价都同时作为权力和义务而存在。

 

当然,考虑到每个成员的学术水平相差悬殊,可以按照职称(如,教授:4;副教授3;讲师:2;助教和博士研究生:1),也可以根据基于国内CSSCI数据库和国际SSCI数据库所计算出的评价者个人的H指数等科学计量学指标,对每个成员的评价赋予不同的权重值(笔者以为,由于职称的实际学术水平在不同地区、不同时期差异甚大,因次,运用H指数进行赋值在某些学科可能更为合理)。如果我们有了这样的学术评价信息化平台,学术评价的成本就能大大降低,效率则能大大提高。因为,对某项科研成果的评价就可随时随地在平台上进行,评价者则可以在成员中随机抽取,并可保证有符合统计学要求的评价者数量,同时,我们还可以对评价过程与结果的信度和效度进行动态和即时的监控。

 

与自然科学研究不同,我国的社会科学研究应该特别强调中国特色,特别强调正确的意识形态导向。但这不能靠拍脑袋、喊口号、或由一两个专家说了算,而必须要有严谨审慎的评价机制设计。笔者以为,上述信息化平台的马克思主义理论学科分平台不仅可以用来评议本学科的科研成果,而且可以用来评议其它具有强烈意识形态色彩的学科如经济学、政治学、法学等的政治方向和学术导向。这种评议结果既可以通过赋予较大的权重,也可以通过“一票否决”的方式体现在最终的总的评价结果中。

 

同时,我们的学术评价信息化平台不应该是封闭的,而应与国家的其它信息化平台实现互联互通,这对我们评价应用类或决策参考类的成果的真实价值尤为重要。长期以来,一个决策参考类课题如果得到了领导采用,就可以结题并万事大吉,但得到领导采用后是否产生了实际效果尤其是正效果呢?就没有人关心了。或者,某个理论工作者在重要报刊上发表了文章,人们往往只关心其是否观点正确、逻辑严密、甚或文字优美,但这一理论文章是否或在多大程度上对广大群众的思想和价值观产生了正面影响,也往往都是未知数。显然要对上述两项成果的真正价值进行评估,就不能仅仅满足于领导采用或观点正确,前者就需要社会经济系统中的若干指标和数据,后者则需要运用心理测量学和传播学的若干方法和技术,这些只靠研究者自己搜集数据来证明显然有一定难度。而与国家的其它信息化平台实现互联互通,就能使我们的学术评价的信息化平台不仅可以用来更加科学地评价社科成果的学术价值,还可以用于更加全面地评估社科成果的社会价值和应用价值。


作者单位:上海财经大学

栏目主编:王多

本文仅代表作者个人观点

图片编辑:曹立媛

题图来源:视觉中国