一篇深度学习论文背后的大规模在线协作

简介: 本文讲述大规模的在线合作完成了一篇深度学习论文,共同研究深度学习在生物医学领域的开发与潜力。


2016年夏季,生物信息学教授Anthony Gitter和Casey Greene发表了一篇关于深度学习的生物医学应用的论文,该论文致力于研究一个热门的新型人工智能领域:模仿人类大脑的神经网络。

该论文完成后还引出了一个有趣的学术众包案例。如今,已有40多名在线合作者对这篇论文进行了大量的编写和修改,甚至其中大多数协作者的贡献足以成为共同作者。

2018年4月4日《皇家学会界面》杂志刊登了最新研究成果“生物学和医学深入学习的机遇与障碍”。

Gitter毕业于威斯康星-麦迪逊大学,现Morgridege研究所工作,Greene毕业于宾夕法尼亚大学,二者皆致力于研究如何用计算工具解决健康和生物方面的巨大挑战。他们希望看到深度学习在这个方面发挥作用,以及在生物医学领域尚未开发的潜力。

Gitter认为这个过程与开源软件社区的工作原理相似。他说:“我们基本上都是在用软件工程的方法撰写学术论文,而选择GitHub网站作为主要写作平台,是因为它是最受欢迎的线上协作编写代码的网站。”Gitter还补充道:“我们还采用了软件工程工作的思路,即让团队共同合作完成一个产品并自动协商下一步工作。”

新的协作作者经常通过提供一些例子来说明深度学习如何影响了他们的科学领域。Gitter举例说,低温电子显微镜技术是生物成像的一个新的必备工具,而一位科学家使用深度学习技术对低温电子显微镜技术的提升做出了重大贡献。其他人重写了这部分,使其更容易被非生物学家接受,还有人提供了关于医疗数据隐私的道德背景。

深度学习是近年来取得突破性进展的机器学习工具的一部分。它利用神经网络的结构将输入馈送到多个层来训练算法。并且可以构建方法来识别和描述数据中的循环特征,同时还能预测一些输出。当深度学习在“无监督”模式下工作时,能够自动解释或识别数据中的有趣信息。

例如一个著名的无监督深度学习案例:谷歌的神经网络在没有人为控制下,能够自动识别视频的重要组成部分,例如该视频主要由面孔、行人和猫组成。

深度学习已经改变了人脸识别、语言翻译等应用程序。例如,在众多高智能的应用程序中有一个能够完成一个项目,即识别并学习著名画家的标志性艺术特征,从而能够将日常图片转换成梵高、毕加索或莫奈的作品。

Greene说,虽然深度学习还没有完全揭示医疗数据中的“隐藏猫”,但是已经取得了一些突破性的进展。现在正在研究的深度学习项目包括,如何根据疾病亚型和最有效的治疗选择对乳腺癌患者进行分类。另一个研究项目是如何在巨大的自然图像数据库上训练深度学习,从而能够诊断糖尿病、视网膜病变和黑色素瘤。而这些应用都远超现在最先进的工具。

深度学习还能改进临床决策,不仅能提高临床试验的成功率,还能更好地预测新药候选药物的毒性。

Gitter说:“深度学习尝试通过整合信息来预测哪些人有可能罹患哪些疾病,这样可以确定谁需要做更多的筛选或测试,以及如何尽早避过这些疾病。这是一种预防性的、前瞻性的思维方式。即使当前技术无法达到这些目标,我和我的合著者仍感觉非常兴奋,因为我们知道这潜在的回报非常巨大。”

 

本文由北邮@爱可可-爱生活 老师推荐,阿里云云栖社区组织翻译。

文章原标题《Scholarly snowball: Deep learning paper generates big online collaboration》

作者:Morgridge Institute for Research 

译者:奥特曼,审校:袁虎。

文章为简译,更为详细的内容,请查看原文

相关文章
|
机器学习/深度学习 数据采集 算法
构建高效图像分类模型:深度学习在处理大规模视觉数据中的应用
随着数字化时代的到来,海量的图像数据被不断产生。深度学习技术因其在处理高维度、非线性和大规模数据集上的卓越性能,已成为图像分类任务的核心方法。本文将详细探讨如何构建一个高效的深度学习模型用于图像分类,包括数据预处理、选择合适的网络架构、训练技巧以及模型优化策略。我们将重点分析卷积神经网络(CNN)在图像识别中的运用,并提出一种改进的训练流程,旨在提升模型的泛化能力和计算效率。通过实验验证,我们的模型能够在保持较低计算成本的同时,达到较高的准确率,为大规模图像数据的自动分类和识别提供了一种有效的解决方案。
|
机器学习/深度学习 自然语言处理 数据挖掘
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
|
机器学习/深度学习 自然语言处理 算法
深度学习-生成式检索-论文速读-2024-09-14(下)
深度学习-生成式检索-论文速读-2024-09-14(下)
|
机器学习/深度学习 存储 自然语言处理
深度学习-生成式检索-论文速读-2024-09-14(上)
深度学习-生成式检索-论文速读-2024-09-14(上)
|
机器学习/深度学习 搜索推荐 算法
深度学习-点击率预估-研究论文2024-09-14速读
深度学习-点击率预估-研究论文2024-09-14速读
|
机器学习/深度学习 自然语言处理 算法
【论文精读】TNNLS 2022 - 基于深度学习的事件抽取研究综述
事件抽取是从海量文本数据中快速获取事件信息的一项重要研究任务。随着深度学习的快速发展,基于深度学习技术的事件抽取已成为研究热点。文献中提出了许多方法、数据集和评估指标,这增加全面更新调研的需求。
901 0
|
机器学习/深度学习 存储 算法
深度学习之大规模模型训练
基于深度学习的大规模模型训练涉及训练具有数百万甚至数十亿参数的深度神经网络,以处理复杂的任务,如自然语言处理、计算机视觉和语音识别。
409 2
|
机器学习/深度学习 数据采集 存储
【2021 第五届“达观杯” 基于大规模预训练模型的风险事件标签识别】2 DPCNN、HAN、RCNN等传统深度学习方案
参加2021第五届“达观杯”基于大规模预训练模型的风险事件标签识别比赛的经验,包括使用DPCNN、HAN、TextRCNN、CapsuleNet和TextRCNNAttention等传统深度学习模型的方案实现,以及提分技巧,如多个模型的提交文件投票融合和生成伪标签的方法。
105 0
|
机器学习/深度学习 编解码 人工智能
2024年2月深度学习的论文推荐
我们这篇文章将推荐2月份发布的10篇深度学习的论文
499 1
|
机器学习/深度学习 自然语言处理 前端开发
2024年3月最新的深度学习论文推荐
现在已经是3月中旬了,我们这次推荐一些2月和3月发布的论文。
815 0

热门文章

最新文章