一群学术大牛做了份机器学习新期刊Distill:让学术论文可交互

简介:
本文来自AI新媒体量子位(QbitAI)


机器学习研究几乎每周都有新进展,不过,这些新进展变成论文呈现在我们眼前的方式,可以说是百余年不变。

昨天,Google Brain的Chris Olah和Shan Carter发布了一份专注于机器学习研究的新期刊:Distill(http://distill.pub/)。不同于过去百余年间的论文,Distill将利用互联网,以可视化、可交互的形式来展示机器学习研究成果。

这份新期刊一经发布,创始人发文Olah表示以后一心搞Distill,不再写博客,Google Research、DeepMind、YC孵化器、OpenAI纷纷发文章进行介绍,Ian Goodfellow等人在Twitter热情转发,Reddit机器学习版也在热烈讨论。

大家的热情不仅仅是因为它背景强大,Distill也确实戳到了从业者们的痛点。

1987年,北京大学的钱天白教授向德国发出了第一封电子邮件。到如今,互联网已经存在了将近30年。然而在这30年间,学术论文不过是原样从纸质期刊搬到了PDF上。

举个栗子:

 Accelerating Eulerian Fluid Simulation With Convolutional Networks
https://arxiv.org/pdf/1607.03597.pdf

心疼写论文和读论文的科研人员3秒钟。

一篇(理想的)Distill文章,能让用户能直接与机器学习模型进行交互,称他们为“读者”都显得不太合适。

在理想的情况下,这样一篇文章能够将解释,代码,数据和交互式可视化工具集成到一个环境中。在这样的环境中,用户可以用传统静态媒体不可能实现的方式来探索这篇文章。他们可以改变模型的结构,尝试不同的假设条件,并且可以立刻看到操作对结果的影响。这能帮助用户们快速建立对文章的理解。

Distill会以标准方式被收录到传统的学术出版系统,如ISSN,CrossRef等中。你可以在Google学术中搜索到Distill的文章,这也有助于文章的作者获得学术信誉。Distill文章使用创作共享署名授权协议(Creative Commons Attribution licenses)授权,简单来说就是引用要署作者名。

Distill不仅可以发表学术论文,也接受高质量的说明性文章。

发布之初,Distill上已经有了几篇Google团队发表的说明性文章,分别关于神经网络的权值、使用t-SNE方法可视化高维数据、使用神经网络生成手写字母等主题。这些文章就是我们上面提到的“高质量说明性文章”,也向我们展示了Distill文章的形式。

创始人Chris Olah和Shan Carter也是进行整体规划和推进方案执行的关键人物。他们二人在创建高质量的说明文章和可视化技巧方面有着大量的经验,致力于支持作者能够加入视觉和动态元素等,对原创文章创造高质量的展示。

Distill发布的背后也缺不了指导委员会的大力支持,包括以下成员:

Yoshua Bengio(蒙特利尔大学)

Mike Bostock(可视化库d3开发者)

Amanda Cox(纽约时报)

Ian Goodfellow(谷歌大脑)

Andrej Karpathy(人工智能非营利组织OpenAI)

Shakir Mohamed(人工智能企业DeepMind)

Michael Nielsen(创业孵化器Y Combinator)

Fernanda Viegas(谷歌大脑)

刚刚宣布要押注AI赛道的YC孵化器对Distill寄予厚望,他们在官方博客上表示,也许有一天,Distill文章将会以自身能力和独特的风格,成为一个创意性的媒体,一个可以自由探索机器学习研究的媒体。

本文作者:王新民 李林
原文发布时间: 2017-03-21
相关文章
|
11月前
|
机器学习/深度学习 人工智能 算法
PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架
PaperCoder是一种基于多智能体LLM框架的工具,可自动将机器学习研究论文转化为代码库。它通过规划、分析和生成三个阶段,系统性地实现从论文到代码的转化,解决当前研究中代码缺失导致的可复现性问题。实验表明,PaperCoder在自动生成高质量代码方面显著优于基线方法,并获得专家高度认可。这一工具降低了验证研究成果的门槛,推动科研透明与高效。
892 19
PaperCoder:一种利用大型语言模型自动生成机器学习论文代码的框架
|
机器学习/深度学习 人工智能 自然语言处理
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
阿里云人工智能平台 PAI 团队发表的图像编辑算法论文在 MM2024 上正式亮相发表。ACM MM(ACM国际多媒体会议)是国际多媒体领域的顶级会议,旨在为研究人员、工程师和行业专家提供一个交流平台,以展示在多媒体领域的最新研究成果、技术进展和应用案例。其主题涵盖了图像处理、视频分析、音频处理、社交媒体和多媒体系统等广泛领域。此次入选标志着阿里云人工智能平台 PAI 在图像编辑算法方面的研究获得了学术界的充分认可。
【MM2024】阿里云 PAI 团队图像编辑算法论文入选 MM2024
|
机器学习/深度学习 人工智能 自然语言处理
【NeurIPS'24】阿里云 PAI 团队论文被收录为 Spotlight,并完成主题演讲分享
12月10日,NeurIPS 2024在温哥华开幕,阿里云PAI团队论文《PertEval: Unveiling Real Knowledge Capacity of LLMs with Knowledge-Invariant Perturbations》入选Spotlight,PAI团队还进行了“可信AI的技术解读与最佳实践”主题演讲,展示AI工程化平台产品能力。
|
机器学习/深度学习 人工智能 自然语言处理
【EMNLP2024】阿里云人工智能平台 PAI 多篇论文入选 EMNLP2024
阿里云人工智能平台 PAI 的多篇论文在 EMNLP2024 上入选。论文成果是阿里云与华南理工大学金连文教授团队、复旦大学王鹏教授团队共同研发。EMNLP 是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究,尤其重视自然语言处理的实证研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台 PAI 在自然语言处理和多模态算法能力方面研究获得了学术界认可。
|
机器学习/深度学习 搜索推荐 算法
机器学习-点击率预估-论文速读-20240916
机器学习-点击率预估-论文速读-20240916
|
机器学习/深度学习 存储 人工智能
【ACL2024】阿里云人工智能平台PAI多篇论文入选ACL2024
近期,阿里云人工智能平台PAI的多篇论文在ACL2024上入选。论文成果是阿里云与阿里集团安全部、华南理工大学金连文教授团队、华东师范大学何晓丰教授团队共同研发。ACL(国际计算语言学年会)是人工智能自然语言处理领域的顶级国际会议,聚焦于自然语言处理技术在各个应用场景的学术研究。该会议曾推动了预训练语言模型、文本挖掘、对话系统、机器翻译等自然语言处理领域的核心创新,在学术和工业界都有巨大的影响力。此次入选标志着阿里云人工智能平台PAI在自然语言处理和多模态算法、算法框架能力方面研究获得了学术界认可。
|
机器学习/深度学习 人工智能 分布式计算
阿里云人工智能平台PAI论文入选OSDI '24
阿里云人工智能平台PAI的论文《Llumnix: Dynamic Scheduling for Large Language Model Serving》被OSDI '24录用。论文通过对大语言模型(LLM)推理请求的动态调度,大幅提升了推理服务质量和性价比。
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 数据采集 自然语言处理
【NLP】讯飞英文学术论文分类挑战赛Top10开源多方案–4 机器学习LGB 方案
在讯飞英文学术论文分类挑战赛中使用LightGBM模型进行文本分类的方案,包括数据预处理、特征提取、模型训练及多折交叉验证等步骤,并提供了相关的代码实现。
217 0
|
机器学习/深度学习 算法 Python
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。
强化学习(Reinforcement Learning, RL)** 是一种机器学习技术,其中智能体(Agent)通过与环境(Environment)交互来学习如何执行决策以最大化累积奖励。