Nature最新研究:数千学者每五天发一篇论文,这些高产作家背后的科研圈

简介:

论文是学术水平的重要体现形式,而不同研究者的发文频率和质量也大不一样。Nature杂志近日进行了一次调研,他们从Scopus数据库里找到了2000年至2016年间,平均每年发布超过72篇文章的作者(约等于每5天发布一篇论文),发现符合这个超高产标准的有超过9000位。

这一结果让Nature非常震惊,于是他们详细分析了这9000多位作者的数据信息,并由此研究了他们背后的科研圈。

Nature称只将“完整的论文”纳入统计——文章,会议论文,实质性评论和综述——而不包括述评,给编辑的信件和类似文件。

这些高产科学家都是谁

9c8518d63a3946eb7f5d9eb23fe276dc823ce6e4

大多数异常高产的作者(记录显示未7888位,约占86%)在物理领域都有发表论文。在高能粒子物理学领域,通常都是超过1000人的大型跨国团队在做项目。所有参与者,只要是团队中的一员都会被列为作者,不一定要参与了论文的写作或者审核。因此我们排除了物理学的作者。

除了刚刚提到的物理领域之外,还有909名作者都是中文或韩文名字。因为Scopus记录的中文或者韩文名字可能无法完美识别,一个名字下可能是不同的人。在2016年(当中文与韩文名的统计方式有所改善时),至少12个(也有可能超过20个)中国作者都非常高产,超过了所有其他国家。我们相信这可能与中国的政策(鼓励发表文章)有联系。

因为这些不明确的作者名字统计方式,我们也在之后的分析中除去了这些名字,还包括那些团体名称或者是有错误的文章(比如说有些新闻报道被误分类为“完整文章”),重复的记录,或者被误归为某个组织名下的会议论文。

这样就只剩下265位作者了。高产作者的数量(在我们去除以上的作者以后)从2001年到2014年增长了20倍,然后趋于平稳。与此同时,作者总数增加了2.5倍。

我们给265位作者发了邮件,询问了他们是如何达到这样高产的级别的。81人的回复都放在了补充信息里。回复中共同的主题是:对研究的热爱;对年轻研究者的辅导;担任某个或者是很多个研究团队的领导;广泛的合作;多领域或者是核心服务的研究;拥有合适且充足数据和资源;大型项目的主导;慷慨和分享个人价值观;增长的经验;一天只睡几个小时。

3cc104be346b326d6dff41cff213aae4c667193c

高产作者的数量逐年递增

大约一半的高产作者都是医学和生命科学领域的(101名医学领域,11名健康科学领域,17名大脑科学领域,6名生物领域,3名传染病学领域)。当我们去除会议论文以后,大概三分之二的作者属于医学和生命科学领域(86/131)。在265名作者中,154名都在连续两年中以每五天一篇的速度发表文章;69名在四年间都保持了这样的速度。在这些文章中常见到10-100名作者,尤其是在医药和生命科学领域,但是像量子物理方向那样有几百个作者的情况却很罕见。

材料科学家井上明久(Akihisa Inoue),日本东北大学的前主席,多个知名学会的成员,也在统计名单之中。他在2000到2016中的12年间都满足了我们对于多产的定义。自从1976年开始,他的名字出现在Scopus数据库的2566篇论文中。他也撤回了与之前发表过的文章有重复的七篇论文。我们在谷歌里搜索了接下来20名高产作者的新闻文章,来检查是否有重复撤回,发现了另外一位作者(Jeroen Bax)也有一篇撤回文章。

265名高产作者分别在37个国家工作,最多是在美国(50名),然后是德国(28名)和日本(27名)。这些作者在美国的占比(19%)大于与美国在科学发表的总占比相同,而日本和德国则超出了比例。众所周知,马来西亚(13名)和沙特阿拉伯(7名)拥有更多的高产作者,这些国家都是用现金奖励来激励发表的国家。

高产作家也更倾向于集中在某些特定的机构,他们经常参与共同研究课题。比如说荷兰的鹿特丹伊拉斯姆斯大学(荷兰语:Erasmus Universiteit Rotterdam,英语:Erasmus University Rotterdam,简称EUR)拥有9名高产作家,比其他任何机构都要多。其中七位作者主要是参与“鹿特丹研究”(一个有着近30年历史的流行病学项目)或其后续的研究有关的论文。这些研究采用数千名老年人的多种健康参数,并发表了几千篇文章。

来自马萨诸塞州剑桥市的哈佛大学的五名高产研究者,也是因为常常共同发表著作。还有11名来自不同机构的高产作家参加了同一个研究项目中,这个项目是欧洲癌症与营养调查研究。其他大型流行学的研究也有同样的特征。高产作家同样也集中在心脏病学和晶体学中。

这些生物和医药方面的高产特征展示了与高能粒子物理领域不同的模式。在瑞士日内瓦附近的欧洲粒子物理实验室(俗称:CERN,欧洲核子研究组织,是世界上最大型的粒子物理学实验室,也是万维网的发祥地 ),拥有成百上千名作者的论文在这种数千名科学家的机构中很常见,在晶体学中,论文的共同作者往往很少。在流行病学和心脏病学,长长的作者列表一般出现在特别研究团队中出现,他们似乎有长名单论文作者的传统。

作者身份的标准

3734dcc2b8c8a0efea950a0c7c078d60dcede876

这引起了一个问题:作为作者到底需要做什么?比如或,在美国国家健康研究院(US National Institutes of Health),对符合条件的研究活动有制定指导意见:积极监督,设计和做实验,在基础工作之外进行数据收集和分析,并起草手稿。

募集资金或者远程指导不符合条件。最近在一次涉及多处地域和学科的近期调查中, 6000名作者中的大多数认为起草一篇论文,解释结果,分析数据才可拥有作者资格,但是不同地区和领域的态度各不相同。

可能最被广泛认定的作者身份标准是1988年的国际医学期刊编辑委员会(The International Committee of Medical Journal Editors in 1988)发布的温哥华标准(Vancouver Criteria)。指出作者必须做到以下四项才能被认可:参与设计或执行实验,处理实验结果;帮助撰写或者修改手稿;确认最终发表版本;对文章的内容负责。

国际医学期刊编辑委员会(The International Committee of Medical Journal Editors)不认为监督、指导或者提供资助能成为作者。我们确实观察到一些作者在正式授予教授、担任系主任或两者兼而有之后,变成超高产(hyperprolific)作者。

对于大型中心担任领导角色的科学家来说,通常需要加速研究产出。例如,担任主任职务的临床心脏病专家发表的论文更多(尽管他们肩负着沉重的临床工作和行政职责)。有时,这种增速令人震惊:在高峰期,一些心脏病学专家一年发表的论文数量比他们在35~42岁时同期增长10倍到80倍。当他们将职权授予继任者之后,论文发表的数量往往急剧下降。另一项研究在二十多年前也揭示了同样的现象。

出人意料的是一些超高产作者在同一本期刊上发表了大量的论文。特别明显的是《晶体学报E辑:在线结构报告》(Acta Crystallographica Section E: Structure Reports Online)(2014年重新启动为带有简要结构数据报告的《E辑:晶体通信》(Section E: Crystallographic Communications),现通过IuCrData进行投稿)以及Zeitschrift für Kristallographie New Crystal Structures(“时代”杂志 新晶体结构,SCI期刊分类:化学(化学-晶体)/物理(物理-晶体)4区;小类:晶体学4区,中科院JCR分区:大类:化学 4区;小类:晶体学4区)。

有三名作者(Hoong-Kun Fun、Seik Weng Ng和Edward Tiekink)均在前者发表了600多篇文章,还有三名作者(Karl Peters、Eva Maria Peters和Edward Tiekink)均在后者发表了超过400多篇的文章。另外,有三名作者(Anne Marie Api、Charlene Letizia、Sneha Bhatia)在一本专注于香味材料评论的《食品和化学毒理学》(Food and Chemistry Toxicology)增刊上发表了许多篇的论文。

Scopus数据库索引的期刊通常被认为是高质量的期刊。一般超高产作者的引用影响就很高,但是,存在很大的差异:每位作者被引用的中位数是19,805次(范围:380至200,439次)。每位超高产作者在2000~2016年之间所有论文的中位数是677篇,其中在所有的超高产作者中,最后作者的占比达42.5%,第一作者占比7.1%,单一作者占1.4%。

这些年来,有中间作者(即,不是单一作者,也不是第一作者或者最后作者)的论文比例的中位数为51%,但对于每个作者而言,论文比例的中位数从2.1%到98.5%不等。

我们承认,我们鉴别超高产作者的方法着实有些粗糙。我们的希望是能引起更深刻的思考:作者署名代表的意义。对于每位作者和每篇论文,以及如何来证明作者署名不可避免存在差异,其规范也因领域而异。

可能有些作者会作弊,通过胁迫或作为一种恩惠而获取作者署名。我们无法从数据中评估这些现象。我们也没有检查贡献者声明,因为它未收录在Scopus数据库中。尽管如此,贡献声明也可以作弊,也可能不准确。

接下来的工作需要进一步探索如何将这些数据更好的规范化,以及确定最佳的标准化水平:例如,对学科范围、相对狭窄的研究领域或者深度特定的研究团队进行调整。

听听作者们怎么说

4efac7f0109cbc43551016cec0543a0f1fce8ccc

为了更好的理解作者署名标准,我们通过电子邮件向2016年的81位超高产作者发送了一份调查报告。询问他们是否完全符合四项温哥华准则(Vancouver criteria)。在完成调查的27人中,大多数人表示他们没有(参见“调查”)。几乎所有的应答者来自美国和欧洲的机构。唯一两名来自其他地区的应答者表示他们大部分的论文中都没有满足温哥华准则。我们的调查可能低估了不符合温哥华准则的作者比例。

调查

2016年,81位超高产作者在被问及他们是否经常能满足医学研究作者署名的4项标准时,三分之一的作者回答了这一问题。在应答的27位作者中,19位作者承认他们在至少25%的情况中没有达到一项标准。11位写到他们25%的情况下没有达到两项或者更多的标准。

 ●  在论文概念或设计方面做出重要贡献;或者承担研究数据的收集、分析或解析工作。(27人中有9人在不到75%的论文中符合此标准)。

 ●  起草论文或者对重点知识内容做出批判性修改(27人中有9人在不到75%的论文中符合此标准)

 ●  确认最终发布的版本(27人中有3人在不到75%的论文中符合此标准)

 ●  承诺对所有研究工作负责(27人中14人在不到75%的论文中符合此标准)

并非所有作者都认同自己论文的最终版本,但确认最终版本对作者来说是必须的。59%的人(27人中的16人)表示,他们在2016年撰写的25篇或更多论文做出的贡献超过任何其他列出的作者。

关于“用你自己的话说,你认为作者署名应该需要什么?”,问题的回答通常可以反映对“重要贡献”的要求,但也反映了对作者署名的评估方式的不满。一位科学家说,“我个人并不认为这些是‘我的论文’,所以没有在我的简历中列出来,因为‘署名作者’和‘联合成员’的作者署名存在区别。”另一位科学家认为,作者署名通常按资历授予,还有一位科学家认为更好的区别至关重要。

“我认为应该有不同级别的作者署名,而不是按顺序所暗示的那种!”有趣的是追踪如何评价创新,如数据引用或正式作者贡献分类法,可以改变作者署名的约定。作者署名规范可以在每个领域,甚至在每个团队中均不同。例如,某些流行病学和心脏病学团队显然更慷慨地提供作者署名;其他则坚持更严格(可能更合适)的作者标准。对于类似的任务和贡献,一项群组研究可能会有20位贡献作者,另一项可能只有3位或没有贡献作者。

例如,基因组研究通常包括许多作者。一个戏剧性的反例,最新发表的一项基因组研究只有一位作者。显然,对比不同团队带头的类似研究,研究者需要付出同样或者数倍工作量才可以授予作者署名。一些证据表明,受到“不发表文章就完蛋了”的压力,每篇论文的平均作者数量的增加并没有反映出团队科学的真实需求。

广泛使用的引用和影响因子指标也应当做以调整。例如,如果增加更多作者会减少每位作者的贡献,那么无理由的多作者可能会减少。我们发现,30名超高产作者似乎从共同作者中获益最多,分别是6位心脏病专家和24位流行病学家(包括从事群体遗传学研究的人员)。(对于这些科学家来说,他们的Hirsch H指数比与他们的共同作者调整的Schreiber H m指数更高。)

总体来说,超高产作者之中不乏最有活力和优秀的科学家。但是,这种论文发表模式至少反应了作者署名的怪异规范。松散的作者署名定义,缺少评审并以论文数量为计量的趋势,模糊了研究者做出的贡献。我们还是需要考量每位科学家发表的论文总数,是否符合自己领域的标准。当然,更重要的是阅读论文和试图理解作者的研究工作。

有一点要声明:我们没有证据表明这些作者是否有任何不合适的行为。一些科学家是大型组织的成员,他们的大量论文都可以达到很高的标准。我们也发现,在一些领域或研究团队中,对于是否成为一篇论文的作者有他们自己的意见和标准。


原文发布时间为:2018-10-7

本文作者:瓜瓜、睡不着的iris、笪洁琼、Aileen

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关文章
|
1月前
|
人工智能 计算机视觉 网络架构
OpenAI攻克扩散模型短板,清华校友路橙、宋飏合作最新论文
扩散模型在生成AI领域取得显著成果,但其训练不稳定性和采样速度慢限制了发展。OpenAI与清华校友合作,提出连续时间一致性模型(CMs),通过TrigFlow等创新解决了这些问题,大幅提升了训练稳定性和计算效率,实现了与最优模型相当的样本质量,同时减少了计算资源消耗。
45 2
|
7月前
|
人工智能
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
最近,一篇发表在《Surfaces and Interfaces》的论文引起了广泛关注,因为其中意外包含了ChatGPT的提示语,暴露出学术审稿过程中的疏忽。这篇论文讨论了铜基金属-有机框架-芳香族纤维素分隔器对锂金属阳极电池的影响,但却出现了不该出现的ChatGPT对话内容。这一事件不仅令人哭笑不得,还引发了对学术审核严谨性的质疑。它反映了当前学术界可能过度依赖AI写作工具,忽略了基本的检查和编辑步骤。这一事件提醒学术界必须加强审查机制和自律,确保论文质量,防止类似尴尬情况的再次发生。
234 4
【SCI论文】“学术丑闻揭露:当AI写作遭遇学术审稿,ChatGPT意外成为论文共作者!“
|
机器学习/深度学习 人工智能 安全
隐语团队研究成果再创佳绩,两篇论文分别被USENIX ATC'23和IJCAI'23接收!
隐语团队研究成果再创佳绩,两篇论文分别被USENIX ATC'23和IJCAI'23接收!
209 0
|
机器学习/深度学习 传感器 存储
为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录
为自动驾驶汽车创造「记忆」,上交校友、康奈尔大学博士生三篇论文被CVPR 2022收录
201 0
|
机器学习/深度学习 人工智能 算法
谷歌大牛Jeff Dean单一作者撰文:深度学习研究的黄金十年
谷歌大牛Jeff Dean单一作者撰文:深度学习研究的黄金十年
147 0
|
机器学习/深度学习 算法
搞强化学习还不了解AutoRL,牛津大学、谷歌等十余位学者撰文综述
搞强化学习还不了解AutoRL,牛津大学、谷歌等十余位学者撰文综述
127 0
|
机器学习/深度学习 人工智能 资源调度
接管创新项目未果,转身就质疑研究造假?谷歌这篇登上《Nature》杂志的研究引发大讨论
谷歌员工声称,今年早些时候某高级研究员曾给另两名初级 AI 研究员“挖坑”——暗示二人研究成果有错,甚至存在伪造行为。
141 0
|
机器学习/深度学习 人工智能 自然语言处理
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
从AI学术顶会IJCAI统计的这些数据中,洞见热门研究趋势。
227 0
IJCAI 2021开幕:程序主席周志华揭晓热门研究主题,杰出论文等奖项出炉
|
机器人
真·鲁班:斯坦福学者造出带羽毛翅膀的「机器鸽」,登上Science及其子刊
传说在 2000 多年前,鲁班用竹木做了一只木鸟。做成之后,这只木鸟立刻展翅而飞,三日都不曾落下。但由于年代久远,这一典故已很难考证。100 多年前,莱特兄弟发明了飞机,但众所周知,飞机的机翼和鸟儿的翅膀并不是一回事,因为前者没有模仿鸟儿翅膀的变形运动等复杂机制。那么,人类真的可以借助鸟儿一样的「翅膀」飞上天空吗?近日,《Science》和《Science Robotics》上的两篇新论文表明,斯坦福大学的研究者已经造出了这样的翅膀。
152 0
真·鲁班:斯坦福学者造出带羽毛翅膀的「机器鸽」,登上Science及其子刊
|
机器学习/深度学习 人工智能 自然语言处理
NIPS大会最精彩一日:AlphaZero遭受质疑;史上第一场正式辩论与LeCun激情抗辩;元学习&强化学习亮点复盘
美国时间周四,NIPS 大会走完了日程的一半。工业界的众多公司搬东西撤出了展览会场,受邀演讲也全部结束。之后亮点除了当地时间周五周六的 Workshop 以外,就是周四下午的四场重要的研讨会——从元学习和深度强化学习,到 DeepMind 刚刚公布的 AlphaZero,以及 Yann LeCun 参加了 NIPS 史上第一次辩论,一天的精彩内容尽在此文中。
232 0
NIPS大会最精彩一日:AlphaZero遭受质疑;史上第一场正式辩论与LeCun激情抗辩;元学习&强化学习亮点复盘