132年未解开的李雅普诺夫函数谜题,被Symbolic Transformer攻克了

简介: 李雅普诺夫函数是评估动态系统稳定性的重要工具,但其存在性难以证明。近期,Meta和Ecole des Ponts的研究团队利用基于Transformer的序列到序列模型,成功解决了多项式与非多项式系统中的李雅普诺夫函数发现难题,准确率高达99%,并在非多项式系统中实现了12.7%的新函数发现率。该研究不仅展示了生成模型在数学问题上的潜力,也为未解数学问题提供了新思路。

在数学领域,李雅普诺夫函数的存在性是判断动态系统全局稳定性的关键。然而,对于这一问题,132年来一直没有找到通用的解决方法。最近,来自Meta和Ecole des Ponts的研究人员提出了一种基于序列到序列的Transformer模型的方法,该方法在解决多项式系统和非多项式系统的李雅普诺夫函数发现方面表现出色,甚至能够发现新的李雅普诺夫函数。

李雅普诺夫函数是数学中用于判断动态系统稳定性的重要工具。如果一个系统存在李雅普诺夫函数,那么它就是稳定的。然而,对于一般的动态系统,找到李雅普诺夫函数是非常困难的,甚至在许多情况下是不可能的。

研究人员提出了一种基于序列到序列的Transformer模型的方法,该方法能够生成合成的训练样本,并使用这些样本来训练模型。他们发现,通过这种方式训练的模型在解决多项式系统和非多项式系统的李雅普诺夫函数发现方面表现出色。

具体来说,他们发现模型能够以99%的准确率在测试集上预测李雅普诺夫函数,并且能够在73%的准确率下处理超出训练分布的测试集。此外,他们还发现,通过在训练集中添加少量的更容易解决的例子,模型的性能可以进一步提高,达到84%的准确率。

对于非多项式系统,找到李雅普诺夫函数是一个更大的挑战,因为没有已知的算法可以解决这个问题。然而,研究人员发现,他们的模型能够以12.7%的准确率发现新的李雅普诺夫函数。

这一研究结果对数学实践具有重要影响。首先,它表明生成模型可以用于解决研究级的数学问题,为数学家提供了可能的解决方案。其次,它为解决其他未解决的数学问题提供了一种新的思路,即使用生成模型来提供解决方案的猜测。

这一研究结果对Transformer模型在解决数学问题方面的能力给予了肯定。然而,也有一些质疑的声音。一些数学家担心,这种基于生成模型的方法可能无法提供对数学问题的深刻理解,而只是提供了一种猜测解决方案的方法。

此外,还有一些技术上的挑战需要解决。例如,如何确保生成的李雅普诺夫函数是正确的,以及如何处理更大规模的系统。

论文地址:https://arxiv.org/pdf/2410.08304

目录
相关文章
|
9月前
|
算法 JavaScript 前端开发
递归的递归之书:第五章到第九章
递归的递归之书:第五章到第九章
170 0
|
9月前
|
存储 JavaScript 前端开发
递归的递归之书:第十章到第十四章
递归的递归之书:第十章到第十四章
66 0
|
3月前
|
机器学习/深度学习 存储 人工智能
NeurIPS 2024:解锁大模型知识记忆编辑的新路径,浙大用WISE对抗幻觉
在AI领域,大型语言模型(LLM)的发展带来了巨大便利,但如何高效更新模型知识以适应世界变化成为难题。浙江大学研究团队在NeurIPS 2024上提出的WISE方法,通过双参数化记忆方案及知识分片机制,有效解决了LLM知识更新中的可靠性、泛化性和局部性问题,显著提升了模型性能。
53 3
|
3月前
|
机器学习/深度学习 人工智能 程序员
大模型时代的思考:小心陷入ChatLLMs构建的蜜糖陷阱-基于人类反馈的间接(反向)驯化-你是否有注意到?
本文探讨了大模型基于人类反馈训练的原理及其潜在风险,特别是大模型在迎合用户需求时可能带来的“蜜糖陷阱”。通过实际案例分析,强调了理性使用大模型的重要性,提出了保持批判性思维、明确人机协作边界、提升人类判断力和创新能力等建议,旨在让大模型真正为人类服务,而不是限制人类思维。
|
4月前
|
机器学习/深度学习 存储 监控
揭秘微调‘失忆’之谜:如何运用低秩适应与多任务学习等策略,快速破解灾难性遗忘难题?
【10月更文挑战第13天】本文介绍了几种有效解决微调灾难性遗忘问题的方法,包括低秩适应(LoRA)、持续学习和增量学习策略、记忆增强方法、多任务学习框架、正则化技术和适时停止训练。通过示例代码和具体策略,帮助读者优化微调过程,提高模型的稳定性和效能。
143 5
|
人工智能 JSON 测试技术
语言模型悄悄偷懒?新研究:​上下文太长,模型会略过中间不看
语言模型悄悄偷懒?新研究:​上下文太长,模型会略过中间不看
145 0
|
算法 测试技术
算法强化每日一题--倒置字符串
算法强化每日一题--倒置字符串
|
算法 搜索推荐 Java
JAVA常用算法流派的详谈
在软件开发领域,算法是解决问题的关键。而JAVA作为一门广泛应用的编程语言,其算法库也非常丰富。本文将详细介绍JAVA常用算法流派,包括搜索算法、排序算法、图算法、字符串算法和动态规划算法等。
160 0
|
算法 C++
【软/自考】算法实用技巧——递归VS迭代
【软/自考】算法实用技巧——递归VS迭代
106 0
|
存储 算法 搜索推荐
Java开发 - 常用算法深度讲解,让你再也不会忘记
Java开发 - 常用算法深度讲解,让你再也不会忘记
168 0
Java开发 - 常用算法深度讲解,让你再也不会忘记