新智元报道
编辑:LRS
【新智元导读】谷歌仍然全球领先,OpenAI每两篇论文就有一篇进百大!
人工智能领域的创新步伐越来越快,论文数量也呈爆炸式增长,甚至达到了人力无法阅读的程度。 在2022年发表的海量论文中,哪些机构的影响力最大?哪些论文更值得读?最近外媒Zeta Alpha用经典的引用次数作为评估指标,收集整理了在2022年最高引的100篇论文,并分析了不同国家、机构在过去三年里发表的高引论文数量。
美国仍然领先,中国第二
按国家来划分的话,美国仍然占据领先地位,不过在Top-100论文中所占的比例相比2020年来说大幅下降。
中国排行第二,数据相比去年略有上涨;第三位是英国,DeepMind去年产出占英国总数的69%,超过了前几年的60%;新加坡和澳大利亚在AI领域的影响力也超出分析师的预期。
按照组织来划分的话,可以看到谷歌始终是AI领域的最强者,紧随其后的是 Meta、微软、加州大学伯克利分校、DeepMind和斯坦福大学,国内排行第一的是清华大学。
作为Meta AI的带头人,Yann LeCun也自豪地宣布Meta在行业内的影响力,并表示Meta AI更重视出版质量,而不是出版数量。
至于同属于Alphabet的谷歌和DeepMind在列表中单独计算的问题,LeCun表示DeepMind一直坚称它们独立于谷歌运营,这很奇怪,谷歌员工无法访问 DeepMind的代码库。
尽管如今人工智能研究大多由工业界引领,单个学术机构产生的影响不大,但由于长尾效应,学术界整体来说还是和工业界持平的,当按照组织类型对数据进行聚合时,可以看到二者的影响力大体是相等的。
如果回顾过去三年,统计各个机构总的研究成果数量,可以看到谷歌仍处于领先地位,但与其他机构相比差距要小得多,值得一提的是,清华大学紧随谷歌排行第二。
OpenAI和DeepMind甚至没有进入前20名,当然,这些机构发表的文章数量较少,但每篇文章的影响力都很大。如果按照出版量进入Top-100的比例来看,OpenAI独树一帜,在转化率上远超其他机构,基本上两篇论文中就有一篇成为「年度百大论文」。当然,从ChatGPT的火爆来看,OpenAI确实很擅长营销,一定程度上促进了引用量的提升,不可否认的是,他们的研究成果质量非常高。
论文收集方法
首先在Zeta Alpha平台上收集每年被引用最多的论文,然后手动检查第一个发表日期(通常是arXiv预印本) 归类到对应的年份中。
通过挖掘Semantic Scholar上高引的人工智能论文来补充这个列表,其覆盖面更广,而且能够按引用次数进行排序,主要是从影响力很大的封闭来源出版商(例如《自然》、《爱思唯尔》、《施普林格》和其他杂志)那里获得额外的论文。
然后将每篇论文在 Google Scholar 上的引用次数作为代表性指标,并根据这个数字对论文进行排序,得出一年内排名前100位的论文。
对于这些论文,使用GPT-3提取作者、他们的附属机构和国家,并手动检查这些结果(如果国家在出版物中没有体现的话,采用该组织总部所在的国家)。
拥有多个机构的作者的论文对每个附属机构各计数一次。