一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: 一周AI最火论文 | 新冠病毒数据开源,Kaggle发布新冠病毒挑战赛

本周关键词:NLP、3D建模、对象检测

本周最火学术研究

新冠病毒科研资料开源

由企业家保罗·艾伦创办的艾伦研究所(Allen Institute)和世界领先的科研小组合作,创建了一个新的、结构化的开放研究数据集(CORD-19),全世界的机器学习社区都可以使用它,来推进新冠病毒(COVID-19)的研究。该数据集是一个统一的免费资源,包含超过四万四千篇学术文章、超过两万九千篇有关COVID-19和冠状病毒家族的病毒的资料全文,供全球研究团体使用。它旨在动员研究人员应用自然语言处理技术的最新进展,为对抗这种传染病提供新的认知。随着新研究每周发表在同行评审的出版物上,语料库将随之更新。

参加CORD-19挑战:Kaggle组织了一个关于新冠病毒的开源研究数据集挑战,旨在激励社区使用CORD-19的数据集,以寻找有关CORD-19的新发现。

报名链接:

https://www.kaggle.com/allen-institute-for-ai/CORD-19-research-challenge

数据集:

https://pages.semanticscholar.org/coronavirus-research

适用于多种人类语言的Python自然语言处理工具包

本文介绍了Stanza,一个支持66种人类语言的开源Python自然语言处理工具包。与现有的其他工具包相比,Stanza具有用于语言分析的不定语言全神经管道,包括标记化、多词标记扩展、词形化、词性和形态特征标记、依赖项解析和命名的实体识别等特征。

研究人员表示,他们对Stanza进行了共计112个数据集的训练(包括Universal Dependencies树库和其他多语种语料库),来证明相同的神经体系结构可以很好地泛化并在所有测试的语言上表现优异。此外,Stanza还使用了一个与Java Stanford CoreNLP软件相连接的本地Python接口,这个接口进一步扩展了原有功能,从而能够涵盖其他任务,例如共引用解析和关系提取。

Stanza的神经管道不仅涵盖广泛的人类语言,由于其结构设计与语言无关、只靠全神经网络,因此也能在所有任务上都准确无误地使用。

源代码、文档和已经训练好的模型(适合66种语言):

https://stanfordnlp.github.io/stanza/

原文:

https://arxiv.org/abs/2003.07082v1

Structured3D:用于结构化3D建模的大型照片数据集

在这项工作中,研究人员展示了一个大型的合成数据集:Structured3D。它具有21835个房间丰富的地面真实3D结构注释,和超过19万6千个逼真的2D渲染。

这一数据集为大型的逼真图像提供了丰富的3D结构注释,可以用于各种结构化3D建模任务。

这个数据集还有许多潜在用途,研究人员从不同方向,进一步证明了它在增加真实数据和促进房间布局估计任务的域适应方面的优势。

研究人员认为,这项工作是构建智能机器重要且令人兴奋的一步,这种机器可以实现人类水平的整体3D场景理解。他们也将合成数据集与真实图像结合使用,训练深层网络进行房间布局估算,并展示了基准数据集的改进性能。


模型:https://arxiv.org/abs/1908.00222v2

原文:https://arxiv.org/abs/1908.00222v2

OpenImage 2019第一名-对象检测和实例分割

本文介绍了OpenImage Challenge 2019中两个冠军团队的项目:分别是用于检测轨道的“MMfruit”和用于分段轨道的“MMfruitSeg”。

在竞赛中,研究人员观察到,即使具有共享特征,一个对象中的不同位置在两项任务上的表现也完全不一致。例如,显著位置的特征通常有利于分类,而对象边缘周围的特征则有利于回归。

从这个发现出发,他们提出去耦头(DH)通过自学习的最佳特征提取来解开对象的分类和回归,从而带来了很大的改进。此外,他们将soft-NMS算法调整为adj-NMS,以获得稳定的性能提升。最后,他们通过对边界框的位置和置信度进行分析,提出了一种精心设计的集成策略。他们的工作还介绍了几种训练/推理策略以及一些技巧,这些技巧可对检测器进行较小的改进。

原文:

https://arxiv.org/abs/2003.07557v1

使用MediaPipe在移动设备上进行实时3D对象检测

Google AI最近发布了MediaPipe Objectron,这是一种用于日常3D对象的实时移动检测方法。它可以检测2D图像中的对象,并通过在新创建的3D数据集上训练的机器学习(ML)模型来估计其姿势和大小。Objectron在MediaPipe中实现,MediaPipe是一个开放源代码的跨平台框架,能够用于构建处理不同形式感知数据的程序,Objectron可以在移动设备上实时计算所面对物体的3D边界框。

为了鼓励研究人员和开发人员根据我们的算法进行实验和原型设计,Google在MediaPipe中发布了其设备上的ML管道,其中包括端到端演示移动应用程序(见链接)以及两个经过训练的模型。

开发者希望通过与广泛的研究社区共享解决方案,并推进新的用例,新的应用程序和新的研究工作。他们计划将模型扩展到更多类别,并在未来进一步改善我们的设备性能。

GitHub链接:

https://github.com/google/mediapipe/

Demo:https://github.com/google/mediapipe/blob/master/mediapipe/docs/objectron_mobile_gpu.md

原文:

https://ai.googleblog.com/2020/03/real-time-3d-object-detection-on-mobile.html


其他爆款论文

在医学图像的背景下更深入地了解对抗性示例,了解基于深度学习的医学图像分析系统的对抗性攻击:

https://arxiv.org/abs/1907.10456v2

基于转换器的、端到端的、语音识别语义掩码:

https://arxiv.org/abs/1912.03010v2

深度学习对CT图像中COVID-19的肺部感染定量:

https://arxiv.org/abs/2003.04655v2

TREC 2019深度学习轨道概述:

https://arxiv.org/abs/2003.07820v1

向可解释的机器学习再迈进一步,透明的深度神经网络:

https://arxiv.org/abs/2003.07631v1

AI大事件

亚马逊的研究人员开发了可改善知识导图性能的AI:

https://venturebeat.com/2020/03/19/amazon-researchers-knowledge-graph-performance/

用于改善机器人操纵性能的计算机视觉,Google和MIT研究视觉转移学习以进行机器人操纵:

https://ai.googleblog.com/2020/03/visual-transfer-learning-for-robotic.html

如何从X射线图像中检测到COVID-19?使用Keras,TensorFlow和深度学习检测X射线图像中的COVID-19:

https://www.pyimagesearch.com/2020/03/16/detecting-covid-19-in-x-ray-images-with-keras-tensorflow-and-deep-learning/?utm_campaign=Artificial%2BIntelligence%2BWeekly&utm_medium=email&utm_source=Artificial_Intelligence_Weekly_153

Microsoft Teams Update添加了AI背景消除功能:

https://www.pcmag.com/news/microsoft-teams-update-adds-ai-background-noise-removal

相关文章
|
7天前
|
机器学习/深度学习 人工智能 编解码
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
Lumina-Image 2.0 是上海 AI Lab 开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transformer架构,支持多种推理求解器,能生成高质量、多风格的图像。
109 17
Lumina-Image 2.0:上海 AI Lab 开源的统一图像生成模型,支持生成多分辨率、多风格的图像
|
2天前
|
人工智能 自然语言处理 数据可视化
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
Data Formulator 是微软研究院推出的开源 AI 数据可视化工具,结合图形化界面和自然语言输入,帮助用户快速创建复杂的可视化图表。
134 9
Data Formulator:微软开源的数据可视化 AI 工具,通过自然语言交互快速创建复杂的数据图表
|
8天前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
738 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
4天前
|
人工智能 Linux 开发工具
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
Kiln AI 是一款开源的 AI 开发工具,支持零代码微调多种语言模型,生成合成数据,团队协作开发,自动部署。帮助用户快速构建高质量的 AI 模型。
315 7
Kiln AI:零代码实现微调模型!自动生成合成数据与微调模型的开源平台
|
5天前
|
人工智能 开发框架 数据可视化
Eino:字节跳动开源基于Golang的AI应用开发框架,组件化设计助力构建AI应用
Eino 是字节跳动开源的大模型应用开发框架,帮助开发者高效构建基于大模型的 AI 应用。支持组件化设计、流式处理和可视化开发工具。
118 27
|
4天前
|
存储 人工智能 NoSQL
Airweave:快速集成应用数据打造AI知识库的开源平台,支持多源整合和自动同步数据
Airweave 是一个开源工具,能够将应用程序的数据同步到图数据库和向量数据库中,实现智能代理检索。它支持无代码集成、多租户支持和自动同步等功能。
49 14
|
3天前
|
人工智能 JSON 搜索推荐
猫步简历 - 开源免费AI简历生成器 | 一键导出PDF/JSON
猫步简历是一款免费开源的AI简历生成器,帮助用户轻松创建独特、专业的简历。支持导出超高清PDF、图片、JSON等多种格式,并提供AI智能创作、润色和多语种切换等功能。拥有海量模板、高度定制化模块及完善的后台管理系统,助力求职者脱颖而出。官网:https://maobucv.com,GitHub开源地址:https://github.com/Hacker233/resume-design。
61 10
|
5天前
|
存储 人工智能 API
ChatGPT-on-WeChat:Star32.4k, DeepSeek加持!这款开源神器秒变AI助手,聊天体验直接起飞!
嗨,大家好,我是小华同学。今天为大家介绍一款结合DeepSeek引擎的开源项目——ChatGPT-on-WeChat,由开发者zhayujie打造。它将微信变成智能AI助手,支持文本、图片、语音对话,具备定时提醒、天气查询等扩展功能,完全开源且易于定制。项目地址:https://github.com/zhayujie/chatgpt-on-wechat。关注我们,获取更多优质开源项目和高效学习方法。
95 11
|
2天前
|
人工智能 编解码 vr&ar
Lumina-Video:上海 AI Lab 开源视频生成框架,动态程度可控,支持多分辨率
Lumina-Video 是由上海 AI Lab 和香港中文大学联合推出的高效视频生成框架,支持高质量视频生成、动态程度控制和多分辨率生成。
69 4
|
7天前
|
人工智能 安全 开发工具
Repomix:8.1K Star!轻松将整个代码库打包为AI友好格式的开源工具,使代码库更易于AI理解
Repomix 是一款强大的工具,能够将整个代码库打包成AI友好的单个文件,支持多种输出格式和安全检查。
59 9

热门文章

最新文章