AI又对奥数下手,刷题刷出「模考」最好成绩

简介: AI又对奥数下手,刷题刷出「模考」最好成绩

AI在最不擅长的数学方面,这次大幅刷新了最好成绩。


其中关键角色是OpenAI给Lean做的一个定理证明器。


听起来有点耳熟?没错,就是去年参加国际数学奥林匹克竞赛(IMO)的“非人”选手Lean~


自从2013年微软研究院推出Lean以来,就一直尝试让AI在数学命题证明这方面取得进展。


而这次也确实得到了回报,OpenAI新做的这个定理证明器让它学会了解决一部分有难度的高中奥数题,包括美国的数学竞赛AMC12、AIME甚至是国际奥数竞赛中的题。


它首先会用语言模型将数学问题转化为另一种形式,列出隐藏的条件和已知信息,然后来推理求证。


虽然在刚开始效果并不明显,只能证明几个命题。但是在不断地搜索新的证明,经过八次迭代之后,在miniF2F测试中,成功地把分数从29.3%刷到了41.2%。


3c28f8d6f0345f125a412dcefc19597a.png


我们来看看这AI是怎么在奥数题上施展拳脚的。


AI如何做奥数题



先来看一个简单的问题热热身:


对于所有大于等于9的整数n,证明下图中的式子是一个完全平方数。


7352e19d204610b7a7d4d78bced1c935.png


按照普通人的思考方式,可以先把式中分子提出一个n的阶乘,与分母约去。


然后分子化简为(n+1)2。这在形式上就是一个完全平方数,问题得证。


那AI是怎么做的呢?


它首先从文本中提取了条件和已知信息,例如n是整数、n大于等于9。


接下来,它把需要证明的问题换了一种说法,改为:


存在一个整数x,使x2和原式相等。


ca49888496c0ab85a9d0528a1ef15b81.png


然后在解题的过程中,完全由模型直接生成了一个数学项“n+1”作为一个解:use n+1。接下来再去验证这个解是否成立。


如果没有语言模型,这是不可能做到的。


这么看来这模型能耐了,还有了一些数学想法,再拿一道国际奥赛的改编题来考考它:


设a、b、c是一个三角形的三条边,证明a2(b+c-a)+b2(c+a-b)+c2(a+b-c)≤3abc。


1e85d0002646d80b1aef510acd2cf1c4.png


同样地,AI还是先把条件都列出来。不过这次还列出了与三角形有关的隐藏条件:


a、b、c都是大于0的实数,并且有任意两边之和大于第三边。


36acf520ff3e0be26346790c553da072.png


然后模型还自创了一个方法,列出了(b-a)、(c-b)、(c-a),看起来好像不明所以。


但是如果把目标式子展开,你就会发现这三项正是舒尔不等式的几个对称项:


37e2805216c8b583f07f1ad5ce4c1e48.png


根据舒尔不等式,对所有非负实数x、y、z和正数t,都有:


6874efdb6c6ed8b04e926bc9b96cb607.png


当t=1时,这和奥数题中的形式完全一样,命题得证。


这么看来,AI这水平着实不简单啊,要构造出这种效果可绝非易事。


对奥数下手的难点



让AI来做奥数,确实比学生自己磕高数题难多了。


这第一个难点就是,模型不是从有限的选项中做选择。要是像下围棋那样,格点就那么多,选择空间有限,还好说一点。


但是做奥数,模型要从一组复杂的无限策略中做选择,期间还要生成一些数学中的术语,例如“存在”、“任意”等。


针对这个难点,OpenAI通过在搜索证明方法时从语言模型中采样来解决。


而第二点就是模型缺乏自我对抗和博弈。做奥数题和双人游戏不同,它不是和另一个玩家比赛,而是要证明一个数学命题。


这样一来在双人游戏上成功的算法就不能迁移过来。


为了解决这个问题,研究人员提供了一套不同难度“教辅资料”,用来辅助描述问题而不需要证明。


当这些辅助的描述难度越来越大时,模型就能解决越来越难的问题。


不过这两个难点,反倒可以成为它的优势。


一方面,因为这类数学命题的证明就是需要推理,需要无限的创造力和洞察力。


另一方面,这种辅助描述式的方法也有助于AI自动推理的发展。


说不好,将来深度学习模型还能征服奥数这座高山。


参考链接:



https://openai.com/blog/formal-math/


相关文章
|
21天前
|
消息中间件 人工智能 运维
|
3月前
|
人工智能 算法
国内AI大模型高考数学成绩超GPT-4o
【7月更文挑战第13天】国内AI大模型高考数学成绩超GPT-4o
|
机器学习/深度学习 人工智能 自然语言处理
比拼“读懂人话”,阿里AI总分首次超越人类成绩
比拼“读懂人话”,阿里AI总分首次超越人类成绩
164 0
|
人工智能 芯片 异构计算
华为尴尬了,高通中端芯片 AI成绩出炉:完胜麒麟970
在今年 10月,高通意外宣布中端处理器高通骁龙675 正式诞生,要知道距离上一款中端芯片骁龙670 登场还没过多久,这芯片的更新换代频率实在是太快了。然而,宣布归宣布,高通骁龙675 的商用时间需要等到 2019年春季,预计 OPPO 或 vivo 的某款设备将会首发这款芯片。
173 0
华为尴尬了,高通中端芯片 AI成绩出炉:完胜麒麟970
|
机器学习/深度学习 人工智能 编解码
|
8天前
|
机器学习/深度学习 数据采集 人工智能
探索AI技术在文本生成中的应用与挑战
【9月更文挑战第26天】本文深入探讨了AI技术在文本生成领域的应用,并分析了其面临的挑战。通过介绍AI文本生成的基本原理、应用场景以及未来发展趋势,帮助读者全面了解该技术的潜力和局限性。同时,文章还提供了代码示例,展示了如何使用Python和相关库实现简单的文本生成模型。
34 9
|
2天前
|
人工智能 自然语言处理 搜索推荐
AI技术在智能客服系统中的应用与挑战
【9月更文挑战第32天】本文将探讨AI技术在智能客服系统中的应用及其面临的挑战。我们将分析AI技术如何改变传统客服模式,提高服务质量和效率,并讨论在实际应用中可能遇到的问题和解决方案。
93 65
|
4天前
|
机器学习/深度学习 人工智能 供应链
精准农业:AI在农业生产中的应用
【10月更文挑战第1天】随着科技的发展,人工智能(AI)逐渐渗透到农业领域,通过精准监控和管理提升了农业生产效率和质量。AI在精准农业中的应用包括:精准农田管理,如个性化灌溉和施肥;作物病虫害识别与预测,及时发现并预防病虫害;智能农机自动化作业,提高作业效率;农产品质量检测与分类,确保品质;农业供应链优化,预测需求和价格。尽管面临数据收集、技术接受度等挑战,AI在精准农业中的未来前景广阔,有望实现全程自动化作业、数据驱动决策及智能预警系统,推动农业可持续发展。
24 11
|
2天前
|
机器学习/深度学习 人工智能 监控
AI与未来医疗:重塑健康产业的双刃剑随着科技的迅猛发展,人工智能(AI)正以前所未有的速度融入各行各业,其中医疗领域作为关系到人类生命健康的重要行业,自然也成为AI应用的焦点之一。本文将探讨AI在未来医疗中的潜力与挑战,分析其对健康产业可能带来的革命性变化。
在医疗领域,人工智能不仅仅是一种技术革新,更是一场关乎生死存亡的革命。从诊断到治疗,从后台数据分析到前端临床应用,AI正在全方位地改变传统医疗模式。然而,任何技术的发展都有其两面性,AI也不例外。本文通过深入分析,揭示AI在医疗领域的巨大潜力及其潜在风险,帮助读者更好地理解这一前沿技术对未来健康产业的影响。
|
4天前
|
机器学习/深度学习 数据采集 人工智能
探索AI在医疗诊断中的应用
【9月更文挑战第30天】本文将探讨人工智能(AI)如何在医疗诊断中发挥重要作用。我们将从AI的基本概念开始,然后深入到其在医疗领域的应用,特别是如何帮助医生进行更准确的诊断。最后,我们将通过一些实际的代码示例来展示AI是如何工作的。无论你是AI专家还是医疗专业人士,这篇文章都将为你提供有价值的信息。

热门文章

最新文章

下一篇
无影云桌面