近日,由OpenAI开发的实验性人工智能模型在国际数学奥林匹克竞赛(IMO)中取得了金牌级别的表现。IMO是一项面向高中生的全球知名赛事,这一突破由OpenAI研究院Alexander Wei宣布。他表示该模型成功解决了2025年IMO六道赛题中的五道,获得42分满分中的35分。这一成绩已足以斩获金牌,标志着AI在高级推理能力领域取得重大的里程碑。
模型表现的评估过程极为严格,三名前IMO奖牌得主对其提交的证明进行了独立评分以确保准确性和一致性。Wei特别说明这款具备高级推理能力的大语言模型目前仍然处于实验研究阶段,未来数月内暂无公开发布计划。
其成功印证了OpenAI采用通用强化学习和测试时计算拓展策略的有效性,而非依赖特定任务的定制化方法。
这一成就展示了AI数学能力的飞速进步。媒体用户Chubby指出,OpenAI在短短15个月内就从AIME(美国数学邀请赛)约12%的正确率跃升至IMO金牌水平。该公司高管曾透露,早期GPT-4模型在AIME中几乎不得分,而“o1-preview”模型已达到50%的正确率,可见其提升速度之快。
该实验模型的成功使OpenAI在复杂问题解决和抽象推理的AI研究领域处于领先地位。虽然模型尚处研究阶段,但其表现标志着AI正在进入传统人类智力主导领域。此类模型的持续发展预计将对多个科学与工程学科产生深远影响。
GPT-5的彩蛋
OpenAI的首席执行官Sam Altman将这一成功称为“曾经遥不可及的梦想”,并视为通向通用智能的中哟啊里程碑。他同时试图给外界降温:虽然GPT-5即将到来,但达到IMO水平的AI大脑仍需数月才能面世,因为其仍处于实验阶段。