OpenAI神秘新模型斩获IMO 2025金牌！GPT-5也要来了？_资讯

OpenAI神秘新模型斩获IMO 2025金牌！GPT-5也要来了？

信息科技

作者：安安

 时间：2025-07-22 10:07:15

近日，由OpenAI开发的实验性人工智能模型在国际数学奥林匹克竞赛（IMO）中取得了金牌级别的表现。IMO是一项面向高中生的全球知名赛事，这一突破由OpenAI研究院Alexander Wei宣布。他表示该模型成功解决了2025年IMO六道赛题中的五道，获得42分满分中的35分。这一成绩已足以斩获金牌，标志着AI在高级推理能力领域取得重大的里程碑。

模型表现的评估过程极为严格，三名前IMO奖牌得主对其提交的证明进行了独立评分以确保准确性和一致性。Wei特别说明这款具备高级推理能力的大语言模型目前仍然处于实验研究阶段，未来数月内暂无公开发布计划。

其成功印证了OpenAI采用通用强化学习和测试时计算拓展策略的有效性，而非依赖特定任务的定制化方法。

这一成就展示了AI数学能力的飞速进步。媒体用户Chubby指出，OpenAI在短短15个月内就从AIME(美国数学邀请赛)约12%的正确率跃升至IMO金牌水平。该公司高管曾透露，早期GPT-4模型在AIME中几乎不得分，而“o1-preview”模型已达到50%的正确率，可见其提升速度之快。

该实验模型的成功使OpenAI在复杂问题解决和抽象推理的AI研究领域处于领先地位。虽然模型尚处研究阶段，但其表现标志着AI正在进入传统人类智力主导领域。此类模型的持续发展预计将对多个科学与工程学科产生深远影响。

GPT-5的彩蛋

OpenAI的首席执行官Sam Altman将这一成功称为“曾经遥不可及的梦想”，并视为通向通用智能的中哟啊里程碑。他同时试图给外界降温：虽然GPT-5即将到来，但达到IMO水平的AI大脑仍需数月才能面世，因为其仍处于实验阶段。

分享到：

英伟达“全双工”语音模型上线：AI交谈像真人般可随时插话，延迟低于0.2秒

 2026-01-19
字节跳动紧急澄清豆包AI眼镜上市传闻：尚无明确销售计划，AI硬件布局引猜测

 2026-01-07
百川智能发布Baichuan-M3 Plus，医学幻觉率骤降至2.6%，重塑医疗AI可信边界

 2026-01-23
北京1400 多所中小学推行人工智能通识课程

 2025-09-16
Midjourney V8开启测试：生成速度提升5倍，支持原生2K渲染，但“高性能”有代价

 2026-03-20
奥运史迎“硅基大脑”：阿里千问成米兰冬奥首个官方大模型

 2026-02-09

热门标签

英伟达“全双工”语音模型上线：AI交谈像真人般可随时插话，延迟低于0.2秒

字节跳动紧急澄清豆包AI眼镜上市传闻：尚无明确销售计划，AI硬件布局引猜测

百川智能发布Baichuan-M3 Plus，医学幻觉率骤降至2.6%，重塑医疗AI可信边界

北京1400 多所中小学推行人工智能通识课程

Midjourney V8开启测试：生成速度提升5倍，支持原生2K渲染，但“高性能”有代价

奥运史迎“硅基大脑”：阿里千问成米兰冬奥首个官方大模型

OpenAI Codex全面攻占Windows，手机远程接管PC，7x24小时“数字员工”来了

英特尔宣战英伟达：AI算力，不是只有GPU一条路

OpenAI亲自下场造机器人：时隔六年，世界模拟能力成为最大底牌

马斯克AI烧钱游戏：xAI去年巨亏64亿美元，靠Starlink养家，还要把算力送上天

8小时狂揽15K美金！Claude Code屠榜黑客松，开源神器爆15万星

魔镜洞察

拜特科技

奇墨科技

致远互联

滴普科技

关于Tech技术加

快速导航

热门推荐

关注我们

微信在线客服

电话： +86 15618587198