Friday, May 2, 2025

AI突破极限解答国际奥赛难题获银牌水平

必读文章
戴浩南
戴浩南https://www.aistar.news
专注于人工智能和量子通信,喜欢研究哲学,擅长将科技发展的逻辑与哲学思维结合,提供创新视角。

Image 0

人工智能突破数学推理:AlphaProof与AlphaGeometry 2在国际数学奥林匹克竞赛中达到银牌水平

近日,通过 AlphaProof 与 AlphaGeometry 2 两大突破性人工智能系统,数学推理领域迎来了重大进展。这两个系统在 2024 年国际数学奥林匹克竞赛(IMO)的六道复杂题目中成功解决了四道,最终得分达 28 分,相当于银牌水平。这是首次有人工智能系统在这一具有极高学术标准和挑战性的数学竞赛中达到了这一成绩。

作为全球规模最大且历史最悠久的顶级数学竞赛,IMO自1959年创办以来,每年吸引来自各国的顶尖中学生投入数千小时的训练,以解答代数、组合数学、几何与数论领域的极难问题。近年来,IMO也成为人工智能学界追求高级数学推理能力的重要基准。而此次AlphaProof与AlphaGeometry 2的表现,则为这一领域设立了全新高度。

Image 1

AlphaProof系统依托强化学习算法架构,结合预训练语言模型与形式化语言,高效地进行数学命题的证明与反驳。形式化语言的使用保证了推理过程的严格性和正确性,与自然语言推理相比,能有效避免虚假的中间推导或答案错觉。然而,形式化路径此前受限于有限的人类案例数据,难以涉足更多高难度问题。

Image 2

为此,AlphaProof团队通过自动将自然语言问题转化为形式化语言,生成了规模庞大的数学训练集,让系统能够在覆盖多学科、多难度问题的同时逐步增强自身推理能力。通过大量模拟练习与动态强化训练,AlphaProof不仅解决了两道代数题和一道数论题,还攻克了仅有5名参赛学生正确解出的该届IMO最难题目,展现了其在数学“突破口推理”上的绝对优势。

Image 3

针对几何题的挑战,AlphaGeometry 2采用了“神经符号混合”架构,通过全新知识分享机制和更强的符号引擎,显著提升了几何题的解答能力。在赛前分析中,AlphaGeometry 2成功解决了过去25年历史IMO几何题目的83%,远超前代系统的53%。在2024年比赛中,它仅用19秒便构建出解决几何问题的关键辅助点与精巧的解题框架,再次证明了其高效性与精准性。

为了探索更加灵活的数学推理方法,研究团队还测试了一种基于自然语言的推理系统,试图减少问题形式化转化的要求。尽管与AlphaProof等形式化系统相比,该方法仍处于早期阶段,但其潜力已初见端倪,为未来数学机器协作带来了更多可能性。

“这些系统为数学家提供了工具,不仅能加速问题解决,也能够启发全新的研究范式。”对于此次技术突破,Fields奖得主、IMO金牌得主蒂莫西·高尔斯教授盛赞道:“它们突破现有人工智能边界,用非直观的方式创造性地解决问题,令人印象深刻。”

未来,AlphaProof、AlphaGeometry 和自然语言推理系统的结合,有望成为科研人员探索未知领域、解决经年未解难题的得力助手。这一突破不仅象征着数学领域的技术进步,也将在科学、工程等相关学科开启更多探索空间,为推动全人类的知识边界作出重要贡献。

此次研究的发展得益于众多领域专家的协作,以及国际数学奥林匹克主办方的支持背景。AlphaProof 与 AlphaGeometry 项目的多团队开发者、Lean 与 Mathlib 社区的贡献者,以及诸多顾问与计算支持人员,均对此次科技成果做出了不可或缺的贡献。

(完)

Image 100


[AI之星网出品] [人工智能数学推理] [国际数学奥林匹克竞赛] [数学证明与几何解题] [AlphaProof与AlphaGeometry] [机器姬][真机智能][机器洞察网][AI之星网][风投高科网][猛虎财经网][硅基科学网]

- Advertisement -spot_img
  1. 这研究的进展提醒我们人类的智慧,其实也在不断被技术反哺,感慨又燃起斗志!

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- Advertisement -spot_img
最新新闻

自主数据分析新突破PraisonAI框架实现全自动化

"技术的极致,是让复杂化于无形,让每个人都能触碰数据的真理。" — 技术为人服务
- Advertisement -spot_img

更多相关文章

- Advertisement -spot_img