史上首次,AI超越人类奥赛金牌得主!吴方法加持,30题做出27道破纪录

简介: 【4月更文挑战第16天】研究人员结合吴方法和符号方法,开发的AI系统在国际数学奥林匹克几何问题测试中,成功解决27个问题,超过人类金牌得主。这项创新将吴方法(一种代数几何证明法)与经典符号方法融合,揭示了在自动化几何定理证明上的新潜力,但也面临证明可读性和软件实现局限等问题。

22.jpeg
在人工智能领域,自动化几何定理证明一直是衡量机器推理能力的重要标准。近期,一项由IIIT海得拉巴、图宾根大学AI中心和剑桥大学的研究团队共同完成的研究,取得了历史性的突破。该团队开发的AI系统,在国际数学奥林匹克(IMO)几何问题的测试中,成功解决了30个问题中的27个,超越了人类金牌得主的解题能力,创下了新的纪录。

这项研究的核心在于将传统的吴方法与现代的符号方法相结合,形成了一种全新的自动化定理证明方法。吴方法,一种基于代数的几何定理证明方法,能够将几何问题转化为多项式方程组进行求解。该方法的优势在于能够自动生成非退化条件,处理平面几何以及立体和高维几何问题,而这些都是传统符号方法难以轻松处理的领域。

研究团队首先对吴方法进行了重新评估,发现其在解决IMO几何问题上表现出惊人的实力。吴方法单独就能解决15个问题,其中包括一些其他方法无法解决的问题。这一发现导致了两个关键的成果:首先,将吴方法与经典的符号方法(如演绎数据库和角度、比例、距离追踪)结合,仅使用CPU笔记本电脑,每道题限时5分钟,就能解决30个问题中的21个,几乎与AlphaGeometry系统的表现相当,足以媲美IMO银牌得主。其次,吴方法甚至解决了AlphaGeometry未能解决的2个问题。通过将AlphaGeometry与吴方法结合,研究团队在IMO-AG-30测试中创下了解决27个问题的新高,成为首个超越IMO金牌得主的AI方法。

这一成就不仅展示了吴方法在自动化几何定理证明中的潜力,也为未来的研究和应用提供了新的方向。传统的符号方法在模拟人类推理过程方面具有优势,而代数方法则在处理更广泛的问题类型上显示出其独特的力量。研究结果表明,这两种方法的结合可以显著提高AI在解决复杂几何问题上的能力。

然而,这项研究也面临着一些挑战和局限性。首先,尽管吴方法在多个问题上表现出色,但其在生成可读性证明方面的不足仍然是一个需要解决的问题。此外,现有的吴方法实现较少,且存在一些不足,如支持的构造有限、性能非最优等,这些都限制了其在实际应用中的发挥。研究团队认为,通过改进现有的软件和方法,传统的符号方法有望超越AlphaGeometry的证明能力,他们鼓励未来的研究不要仅基于生成人类可读证明的能力来评价吴方法。

论文地址:https://arxiv.org/abs/2404.06405

目录
相关文章
|
2月前
|
人工智能 算法 测试技术
脑洞大开丨让 AI 写代码,能做出什么样的项目?
AI 编程助手通义灵码可补全代码、写测试、调试和生成注释代码。现在推出全民体验活动,参与者有机会赢取 iPhone15、Switch 等大奖。
|
2月前
|
人工智能
阿里数赛首次向AI开放!
【2月更文挑战第24天】阿里数赛首次向AI开放!
23 1
阿里数赛首次向AI开放!
|
8月前
|
人工智能 关系型数据库 分布式数据库
新生产力工具AI推动下一级人类文明跃迁? AI如何倒逼数据库的进化? AI加持后的数据库应用场景有哪些变化?
新生产力工具AI会催生下一级人类文明跃迁吗? 数据库进化出了哪些与AI相结合的能力? AI加持后的数据库应用场景有哪些变化?
1049 0
|
3月前
|
人工智能 Cloud Native 搜索推荐
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
金融先锋联盟发布17份联合解决方案,首次聚焦AI应用场景探索
71 0
|
4月前
|
人工智能 数据安全/隐私保护 芯片
AI日报:大型律师事务所首次推出人工智能工具撰写合同
AI日报:大型律师事务所首次推出人工智能工具撰写合同
58 0
|
7月前
|
机器学习/深度学习 人工智能 编解码
用 AI 修复亚运珍贵史料——基于Stable Diffusion WebUI 体验AIGC加持的修复能力
2023年,正值亚运110周年,也是第19届杭州亚运会即将举办之际,阿里云与亚奥理事会合作,发起“历久弥新——用 AI 修复亚运会珍贵史料”活动(以下简称“本活动”),开发者使用阿里云的 AI 技术对亚运会历史老照片进行修复,重燃亚运经典,为亚运助威,并有机会入选“亚运史上第一个 AI 修复特展—— 1974 年德黑兰亚运会特展”。
1245 4
|
11月前
|
人工智能 自然语言处理 自动驾驶
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文(1)
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
159 0
|
11月前
|
机器学习/深度学习 Web App开发 人工智能
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文(2)
近十年首次,国内机构上海AI Lab、武大、商汤研究获CVPR 2023最佳论文
227 0
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
比拼“读懂人话”,阿里AI总分首次超越人类成绩
比拼“读懂人话”,阿里AI总分首次超越人类成绩
133 0