中国论文引用比例高,是“自嗨”吗
近期,美国科学杂志网站《科学圈内人》专栏发表一篇文章,题目为《中国的科学家经常引用本国的研究成果,是否扭曲了全球研究排名?》。
文章引用了两项分析:日本国家科学技术政策研究所发布的一项研究显示,中国在2020—2022年间被引用次数最多的前10%论文中,有62%的引用来自国内学者,这一比例远高于其他国家;德国慕尼黑大学的研究人员,筛选出2000—2021年20个科学领域内排名前10%的460多种期刊发表的所有论文,研究显示中国学者论文获得的引用中,57%来自国内研究人员,这一比例在所有被研究国家中最高,而美国则以37%的本土引用率位居第二。
对于造成这种情况的原因,慕尼黑大学研究人员给出的解释是“本土偏好”,纠正了这一本土偏好后,中国在2000—2021年顶级期刊中的总引用量排名从第二位降至第四位,落后于美国、英国和德国。由此,研究人员得出结论:中国在引文排名中的显著上升被夸大了。
客观地说,这些研究者对中国科研的发展现状比较敏锐,引用率的大幅提升恰恰是中国科技快速发展的直接表征。引用率“浮肿”是一个世界性现象,研究者给出的解释有合理的地方,但仅停留在表面。上述研究人员对与中国科技体制机制有关的深层原因并未涉及。
引用率从评价手段向目的蜕变
众所周知,引用率原本是管理者为了评价科研人员的工作质量而选择的一种评价指标。这一评价体系还预设高引用率代表高质量,从节省时间成本看,这既符合经济原则,又满足了客观评价的要求。因此,引用率指标快速被管理部门与科学共同体接受。
在国内,出于绩效主义的考虑,引用率在当下的学术界已成为获得承认的重要标的物,小到评价个人水平、中到评价一本刊物、大到评价整个国家或区域的科技发展水平。这种转变让引用率指标的初始功能从评价手段向评价目的蜕变,这种现象被称作引用率的异化。引用率异化会带来哪些潜在危害?
首先,导致科技评价模式出现严重的路径依赖,并最终演变为路径锁定,一旦形成评价习惯固化很难改变。由于引用率指标的简单且客观,并且能够在相当程度上屏蔽人情关系的影响,科技管理部门很喜欢这种评价手段。由于管理部门的认可与加持,这种评价模式迅速完成从点到面的扩散,久而久之,人们内心中把这种评价模式视作理所当然。随着对这种评价习惯的认知固化,人们很难再逃出它的掌控。既然改变不了,人们就开始利用这套评价标准自身的漏洞,制造出很多匪夷所思的引用乱象,如“巴结引”“被迫引”“相互引”“谄媚引”等。
其次,科技评价体制具有再生产功能。试想SCI(科学引文索引)在中国科技评价体系中的引入不到四十年时间,其弊端早已充分显现,然而要取消这套评价体系却异常艰难。要知道当年采取SCI评价标准并不是国家强制推行的结果,而是各个科研部门主动加入的结果,这就是科技评价体制内在所具有的再生产功能的最好体现。回到引用率问题,当管理部门在各个环节把引用率作为评价人才水平的重要指标时,引用率的再生产机制无形中就被启动了。当信息分析机构每年推出高被引学者排名、高被引文章排名、个人代表作的引用率排名,国家的引用率排名等仍被追捧时,引用率的异化无非是再生产机制的副产品而已。
最后,过分追求引用率会造成科技界的泰罗制以及绩效主义的泛滥。当引用率会带来更大承认与经济回报时,科技共同体会被这根指挥棒驱使,这会误导科技的发展方向,避实就虚,为论文而论文,真正事关国计民生的“卡脖子”问题反倒少有人问津。这不仅会造成虚假学术繁荣,还会加剧科技界的无效“内卷”。事实上,可以进一步考察高被引论文以及高被引学者,到底解决了哪些实际问题?为人类贡献了多少原创性知识?
从线性评价向多元化评价转变
除了“本土偏好”这一原因之外,到底是什么因素导致中国论文引用率大幅提升呢?深层原因有三。其一,最根本原因就是中国科技体量庞大,科技论文产出数量巨大,在时间累积效应加持下,由此带来引用率的快速提高本是题中应有之义;其二,中国学术界的跟风研究传统带来引用的短期井喷现象,导致每次热点问题一经出现,就会引来大量中国学者的快速跟进,热潮过后,等待下一波热点,每一次热点跟风研究都会带来巨大引用数量,这自然会带来间歇性的引用井喷现象;其三,有些议题是中国独特的或者占优势的研究领域,此类文献成果大多由中国科研人员产出。因此,引用的文献库存也大多是中国学者做出来的,这类研究的引用自然也就以本土学者的文献为主,反之亦然。
从这一意义上说,中国论文发文量与总引用率提高是一种相互促进的现象。回到文献的平均引用率,中国也仅仅刚过世界平均水平。需要警惕的是,对于引用率指标的使用不能使之成为新的科技评价神器。从路径依赖滑落到路径锁定往往比我们想象的来得快。那么,如何从制度设计层面最大限度上遏制路径依赖偏好?
从理念上,要努力克服科技的线性评价观,拥抱复杂的多元化评价观。多个成功评价指标的分布式并行运用,将极大稀释单一指标带来的指标功能异化趋势,从而更全面科学地评价科技成果以及科技人才。多元化的评价指标不但能起到功能分流的作用,也能更好符合不同学科的差异性,比如评价马斯克,我们不需要看他的论文有多少引用率,只要看他取得的实际科技成就就可以了。
从线性评价到多元化评价的转变是科研生态良好的标志。今天,中国的科技界需要开始关注那些长期被单一评价指标扭曲与异化的领域,只有这样我们才能在另一个科技赛道,即实践领域取得重大突破。今天,中国的论文发文总量与引用率都已位居世界前列,如果评价标准多元化,那些被遮蔽的科技赛道同样会茁壮成长起来,并取得令世界瞩目的成就。
(作者系上海交通大学科学史与科学文化研究院院长)
本文转自于 中国新闻网周刊