ACL 2019 接收论文榜单发布,我们做了可视化分析

简介: 自然语言处理领域顶级会议 ACL 将于 7 月 28 日至 8 月 2 日在意大利佛罗伦萨举行。今天,ACL 2019 官方网站公布了接收论文列表,机器之心对今年接收论文的关键词等信息进行了可视化分析。

接收论文列表:http://www.acl2019.org/EN/program/papers.xhtml


在论文接收列表中,我们可以看到清华大学的孙茂松组共有 9 篇论文被接收,来自加州大学圣芭芭拉分校(UCSB)的王威廉组(William Yang Wang)有 8 篇论文被接收,全组共有 7 长两短;哈工大刘挺教授也有 3 篇论文入选。

香侬科技 CEO、人民大学信息学院副教授李纪为也有两篇论文入选了 ACL 2019。


论文数量爆炸式增长


今年 3 月,ACL 官方公布了今年大会收到的投稿数量——2906 篇,相比于去年的 1544 篇出现了大幅增长。除去撤回论文等,ACL 2019 共收到有效论文 2694 篇,包括 1609 篇长论文和 1085 篇短论文。


据统计,ACL 2019 共接收了其中的 765 篇论文,接收率为 25.8%(去除了 Student Workshop 论文)。相比于前两年 24% 左右的接收率,今年 ACL 的论文接收率略有上升。


B9029C9B-3442-4480-BC19-BB9C51C86E62.jpeg

近 20 年来 ACL 大会论文投递数量、评审人员数量和(高级)领域主席数量变化趋势图


信息提取与文本挖掘、机器学习、机器翻译领域提交论文数量最多


提交论文数量位列前三的领域与 ACL 2018 一致:


  • 信息提取与文本挖掘(占 ACL 2019 有效提交论文总数的 9.2%,去年该领域论文所占比例为 11.5%);
  • 机器学习(8.2% ACL 2019 vs. 7.4% ACL 2018);
  • 机器翻译(7.7% ACL 2019 vs. 8.3% ACL 2018)。


71FD60F6-EC41-4142-89DC-F5DC3CA056B1.jpeg

各领域提交论文情况。


接收论文列表可视化分析


各类论文数量统计


今年的 ACL 共接收了 765 篇论文,其中长论文 447 篇,短论文 213 篇,System Demonstration 论文 34 篇,student workshop 论文 71 篇。


0CAA7CD9-4009-47B3-8684-A8E3598F7DA6.jpeg

各类 Paper 数量


2319C31D-A03E-46A8-B39E-6BDB76845D00.png

各类 Paper 占比


关键词分析


通过对接收论文列表进行统计,机器之心找出了今年 ACL 接收论文的十大关键词,如下图所示。从图中可以看出,除了「neural」、「learning」、「machine」等常见高频词外,「embedding」、「question」、「generation」等相关子领域名词也成为了今年的热点关键词。


590E1BB7-12CB-4075-B1BA-879931E75197.jpeg

Top10 关键词占比


词云


机器之心对所有论文的标题关键词制作了词云,展示整体关键词的词频分布情况。


4178886F-AFE9-41A0-A6A5-D5A678842AC9.jpeg


深度Pro

理论详解 | 工程实践 | 产业分析 | 行研报告


机器之心最新上线深度内容栏目,汇总AI深度好文,详解理论、工程、产业与应用。这里的每一篇文章,都需要深度阅读15分钟。

相关文章
|
分布式计算 数据可视化 大数据
用Spark分析Amazon的8000万商品评价(内含数据集、代码、论文)
尽管数据科学家经常通过分布式云计算来处理数据,但是即使在一般的笔记本电脑上,只要给出足够的内存,Spark也可以工作正常(在这篇文章中,我使用2016年MacBook Pro / 16GB内存,分配给Spark 8GB内存)。
19489 0
|
2月前
|
开发框架 API 决策智能
ModelScope-Agent框架再升级!新增一键配置多人聊天,配套开源多智能体数据集和训练
ModelScope-Agent是魔搭社区推出的适配开源大语言模型(LLM)的AI Agent(智能体)开发框架,借助ModelScope-Agent,所有开发者都可基于开源 LLM 搭建属于自己的智能体应用。在最新升级完Assistant API和Tool APIs之后,我们又迎来了多智能体聊天室的升级,通过几分钟快速配置即可搭建一个全新的聊天室。
|
2月前
|
人工智能 自然语言处理 文字识别
社区供稿 | 元象首个多模态大模型XVERSE-V开源,刷新权威大模型榜单,支持任意宽高比输入
元象公司发布了开源多模态大模型XVERSE-V,该模型在图像输入的宽高比方面具有灵活性,并在多项评测中展现出优越性能,超越了包括谷歌在内的多个知名模型。XVERSE-V采用创新方法结合全局和局部图像信息,适用于高清全景图识别、文字检测等任务,且已在Hugging Face、ModelScope和GitHub上开放下载。此外,模型在视障场景、内容创作、教育解题、百科问答和代码生成等领域有广泛应用,并在VizWiz等测试集中表现出色。元象致力于推动AI技术的普惠,支持中小企业、研究者和开发者进行研发和应用创新。
|
2月前
|
数据可视化
R语言推特twitter网络转发可视化分析
R语言推特twitter网络转发可视化分析
|
2月前
|
数据可视化
R语言推特twitter转发可视化分析
R语言推特twitter转发可视化分析
|
11月前
|
自然语言处理 运维 机器人
GPT学术优化 (GPT Academic):支持一键润色、一键中英互译、一键代码解释、chat分析报告生成、PDF论文全文翻译功能、互联网信息聚合+GPT等等
GPT学术优化 (GPT Academic):支持一键润色、一键中英互译、一键代码解释、chat分析报告生成、PDF论文全文翻译功能、互联网信息聚合+GPT等等
|
8月前
|
机器学习/深度学习 自然语言处理 算法
【网安AIGC专题10.25】论文7:Chatgpt/CodeX引入会话式 APR 范例+利用验证反馈+LLM 长期上下文窗口:更智能的反馈机制、更有效的信息合并策略、更复杂的模型结构、鼓励生成多样性
【网安AIGC专题10.25】论文7:Chatgpt/CodeX引入会话式 APR 范例+利用验证反馈+LLM 长期上下文窗口:更智能的反馈机制、更有效的信息合并策略、更复杂的模型结构、鼓励生成多样性
114 0
|
9月前
AppsFlyer 研究(十二)Google Ads MCC 配置统计应用转化
AppsFlyer 研究(十二)Google Ads MCC 配置统计应用转化
|
11月前
|
数据挖掘 测试技术
【论文速递】EMNLP 2022 - 一种大规模中文标题数据集的开放事件抽取基准
事件抽取(EE)对于新聚合和事件知识图构建等下游任务至关重要。大多数现有的EE数据集手动定义固定的事件类型,并为每种事件设计特定的模式
144 0
|
机器学习/深度学习 Web App开发 自然语言处理
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022
基于神经标签搜索,中科院&微软亚研零样本多语言抽取式摘要入选ACL 2022