近日,有技术人士在 OpenAI 的 Mac 客户端(ChatGPT Agent 应用)中发现了疑似 GPT-5 系列的两个测试模型 ——GPT-5-Auto 与 GPT-5-Reasoning,引发行业广泛关注。尽管 OpenAI 尚未正式发布 GPT-5 的相关信息,但上述发现表明其下一代人工智能模型已进入内部测试阶段,且在自主性与推理能力方面有望实现显著突破。
从技术论坛及社交媒体披露的信息来看,相关代码片段显示,GPT-5-Reasoning 的配置记录中包含 “reasoning_effort: high” 参数,凸显其对高强度推理任务的专注。该模型被认为是 OpenAI o 系列推理模型的技术延续,在代码调试、数学问题求解及跨领域分析等场景中表现突出,在 AIME2024/2025 和 Codeforces 等基准测试中,性能超越 GPT-4o 和 o3-mini,错误率降低约 20%。其核心创新的 “动态推理分配” 机制,可依据任务复杂度灵活调配计算资源,在软件工程、科学研究等领域具备明显应用优势。
而 GPT-5-Auto 的命名则暗示其自动化导向的设计理念,旨在减少用户干预,提升自主任务执行能力。据推测,该模型可能通过集成外部服务,实现多步骤任务处理。同时,传闻其上下文窗口将扩展至 100 万 token,可大幅提升长文本处理与上下文记忆能力,有效解决传统模型因上下文丢失导致的性能波动问题。