Facebook这个神经网络用自然语言表示数学式,秒解微分方程!

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
简介: Facebook AI的研究人员将数学视为自然语言,并将数学简写拆分为基本单位,去训练神经网络,从而秒解微积分表达式,远超目前的商业软件(如Maple、Matlab、Mathematica)!具体的精妙思想跟操作是怎么样的呢?

微信图片_20220107194223.jpg


Facebook的神经网络也可以计算积分和求解微分方程啦!尽管其他的神经网络还没有超越简单的加减法和乘除法。这是怎么回事呢?让我们来一探究竟!


近日,Facebook AI Research的研究人员Guillaume Lample 和 François Charton 开发了一套新算法,只需一点思考的时间就可以解出一阶微分方程。他们训练了一个神经网络来执行必要的符号推理,首次实现了对数学表达式的微分和积分。这项成果是迈向更强大的数学推理的重要一步,也是利用神经网络超越传统模式识别任务的新方法。


在模式识别任务(如面部和物体识别,某些自然语言处理,甚至是玩象棋、围棋和太空侵略者这样的游戏)上,神经网络已经取得了巨大的成就。但是,尽管付出了很大努力但仍没人能够训练神经网络完成像数学那样的符号推理任务,神经网络所取得的最好成绩是整数的加法和乘法。神经网络和人类相似,分析高级数学表达式的难点之一是它们所依赖的简写。例如,微信图片_20220107194220.png表达式是x乘以x乘以x的简写形式。要让神经网络 “掌握” 这种逻辑非常困难。如果它们不明白简写代表什么,那么就几乎学不会如何使用简写。实际上,人类也有类似的问题,但解决办法通常是从小就开始灌输。


从本质上来讲,微分和积分的运算过程仍涉及到模式识别,尽管被数学简写所遮蔽。


将数学式表示为自然语言


Lample和Charton 提出了一种优雅的解决方法:他们先将数学简写拆分为基本单位;然后教神经网络去识别积分和微分中包含的数学运算模式;最后他们再用全新的表达式去测试神经网络,并将结果与传统运算器(如Mathematica和Matlab)进行对比。


这个过程的第一步,是把数学表达式分解成它们的组成部分,Lample和Charton通过将表达式表示为树状结构来实现:这些树上的叶子是数字、常量和变量,如x;内部节点是运算符,如加法、乘法、微分等。


如:表达式


微信图片_20220107194217.png


可分别表示为:


微信图片_20220107194214.png


如果不同树的数学运算结果相同,那么就认为这些树是相同的,如:2 + 3 = 5 = 12 - 7 = 1 x 5是相同的。这样以来,表达式简化相当于找到一个更短的等价树表示。这些树也可以写成每个节点连续组成的序列,现在正好可以被一种名为Seq2Seq的神经网络来处理。这种方法也被用于机器翻译:其中一种语言的单词序列必须翻译成另一种语言的单词序列。而他们的方法本质上是将数学视为一种自然语言。


下一步就是训练过程,这需要大量的数据来学习。Lample 和 Charton 通过从二元运算符库(如加法、乘法等)、一元运算符库(如cos、sin和exp)以及一组变量、整数和常数(如π和e)中随机组合数学表达式来创建新的数据库。他们还限制了树的内部节点数量,以免方程变得过于庞大。即使节点和数学组件的数量相对较少,可能的表达式也是很多的。然后利用计算机代数系统对每个随机方程进行积分和微分;任何无法积分的表达式都会被丢弃。


通过这种方式,研究人员生成了一个庞大的训练数据集,其中包含8000万个一阶和二阶微分方程示例、2000万个分部积分表达式示例。神经网络使用这些数据集进行训练,学习如何对给定的数学表达式求导或积分。


最后,Lample和Charton在神经网络中输入了5000个以前从未见过的表达式,并将500个例子的结果与商业软件(如Maple、Matlab和Mathematica)等的结果进行了比较。


结果显示,在所有的任务中,都观察到神经网络明显优于Mathematica;在函数积分方面,神经网络的准确性接近100%,而Mathematica勉强达到85%;Maple和Matlab软件包的平均性能不如Mathematica。

 

在许多情况下,传统的运算器在30秒的时间内根本找不到解;而神经网络需要大约1秒钟就能找到解。

 

论文简介:求解器的未来是数学框架+神经网络


微信图片_20220107194212.png


论文链接:https://arxiv.org/pdf/1912.01412.pdf


本文证明了标准seq2seq模型可以应用于诸如函数积分或求解微分方程之类的困难任务。本文提出了一种生成任意大的方程式数据集及其相关解的方法,并证明了在这些数据集上训练的简单转换器模型在计算函数积分和求解微分方程方面都表现出色,其表现优于依赖大量算法和启发式方法的最新数学框架(如Matlab或Mathematica) ,以及复杂的其他实现方式。

 

实验结果还表明,该模型能够以完全不同的方式编写相同的表达式。鉴于神经模型难以执行更简单的任务(例如整数加法或乘法),因此这些结果令人惊讶。但是,提出的假设有时是不正确的,并且通常需要考虑多个波束假设才能获得有效的解决方案。模型本身并未提供解决方案本身的有效性,而是由外部符号框架提供的。这些结果表明,将来,标准数学框架可能会将神经网络组件集成到求解器中,从而提高性能。


微信图片_20220107194209.png


图1 不同运算符和表达式下的树和叶子的不同数量

 


微信图片_20220107194205.png


图2 本文seq2seq模型求解微分方程/积分方程精度与其他求解方案的对比


微信图片_20220107194202.png


图3 本文seq2seq模型求解测试集500个方程的精度与Mathematica, Maple和Matlab求解结果的对比


该论文一出,各学术研究者都纷纷加入了激烈的讨论之中!


微信图片_20220107194159.png


对于这个新的研究成果,您怎么看?

相关文章
|
7月前
|
机器学习/深度学习 自然语言处理 数据可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
|
22天前
|
机器学习/深度学习 资源调度 算法
图卷积网络入门:数学基础与架构设计
本文系统地阐述了图卷积网络的架构原理。通过简化数学表述并聚焦于矩阵运算的核心概念,详细解析了GCN的工作机制。
58 3
图卷积网络入门:数学基础与架构设计
|
2月前
|
机器学习/深度学习 数据可视化
KAN干翻MLP,开创神经网络新范式!一个数十年前数学定理,竟被MIT华人学者复活了
【10月更文挑战第12天】MIT华人学者提出了一种基于Kolmogorov-Arnold表示定理的新型神经网络——KAN。与传统MLP不同,KAN将可学习的激活函数放在权重上,使其在表达能力、准确性、可解释性和收敛速度方面表现出显著优势,尤其在处理高维数据时效果更佳。然而,KAN的复杂性也可能带来部署和维护的挑战。论文地址:https://arxiv.org/pdf/2404.19756
58 1
|
2月前
|
机器学习/深度学习 存储 自然语言处理
从理论到实践:如何使用长短期记忆网络(LSTM)改善自然语言处理任务
【10月更文挑战第7天】随着深度学习技术的发展,循环神经网络(RNNs)及其变体,特别是长短期记忆网络(LSTMs),已经成为处理序列数据的强大工具。在自然语言处理(NLP)领域,LSTM因其能够捕捉文本中的长期依赖关系而变得尤为重要。本文将介绍LSTM的基本原理,并通过具体的代码示例来展示如何在实际的NLP任务中应用LSTM。
180 4
|
3月前
|
机器学习/深度学习 自然语言处理 计算机视觉
用于图像和用于自然语言的神经网络区别
主要区别总结 数据结构:图像数据是二维像素矩阵,具有空间结构;文本数据是一维序列,具有时间结构。 网络架构:图像处理常用CNN,注重局部特征提取;自然语言处理常用RNN/LSTM/Transformer,注重序列和全局依赖。 操作单元:图像处理中的卷积核在空间上操作;自然语言处理中的注意力机制在序列上操作。
30 2
|
7月前
|
机器学习/深度学习 存储 算法
卷积神经网络(CNN)的数学原理解析
卷积神经网络(CNN)的数学原理解析
222 1
|
5月前
|
算法 安全 网络安全
支付系统,网络安全06----支付安全---,机密性,加密算法,目前最流行的加密算法,AES加密算法,目前最流行的非对称加密算法RSA,对称加密和非对称加密的优缺点,非对称加密是基于非常复杂的数学算法
支付系统,网络安全06----支付安全---,机密性,加密算法,目前最流行的加密算法,AES加密算法,目前最流行的非对称加密算法RSA,对称加密和非对称加密的优缺点,非对称加密是基于非常复杂的数学算法
|
7月前
|
数据采集 存储 Scala
挖掘网络宝藏:利用Scala和Fetch库下载Facebook网页内容
本文介绍了如何使用Scala和Fetch库下载Facebook网页内容,同时通过爬虫代理服务(以亿牛云为例)绕过网络限制。代码示例展示了配置代理服务器、多线程爬取及内容存储的过程。注意实际应用时需替换代理服务器配置和目标URL,并考虑应对复杂的反爬虫机制。此方法兼顾匿名性和效率。
102 3
挖掘网络宝藏:利用Scala和Fetch库下载Facebook网页内容
|
7月前
|
机器学习/深度学习 自然语言处理 安全
探索机器学习中的自然语言处理技术网络安全与信息安全:保护数据的关键策略
【5月更文挑战第27天】 在数字化时代,自然语言处理(NLP)技术是连接人类语言与计算机理解的桥梁。本文将深入探讨NLP的核心概念、关键技术以及在不同领域的应用实例。我们将从基础原理出发,解析词嵌入、语法分析到深度学习模型等关键步骤,并讨论NLP如何推动聊天机器人、情感分析和自动文摘等技术的发展。通过案例分析,揭示NLP在实际应用中的挑战与前景,为未来研究和应用提供参考。
|
7月前
|
机器学习/深度学习 算法 Python
LSTM(长短期记忆)网络的算法介绍及数学推导
LSTM(长短期记忆)网络的算法介绍及数学推导
158 0