OpenAI为Codex升级，推出新版GPT-5_资讯

OpenAI为Codex升级，推出新版GPT-5

信息科技

作者：安安

 时间：2025-09-17 10:14:06

OpenAI 升级推出 GPT-5(1)

人工智能编程工具正式进入“自主代理”时代，OpenAI的新模型让AI程序员能够独立处理复杂工程任务，连续工作7小时而不中断。OpenAI宣布为其AI编程工具Codex推出全新版本GPT-5-Codex。该模型基于GPT-5优化，专门针对“自主编程”场景进行训练，具备动态思考时间分配特性。根据OpenAI官方说明，这个新模型处理编程任务的耗时可以从几秒到7小时不等，能够在智能体编程基准测试中表现出更出色的性能。

01 动态思考：智能分配计算资源

GPT-5-Codex的核心创新在于其动态“思考能力”。它能够根据任务的复杂程度实时调整处理时间，不再需要人工预设计算资源。对于简单请求，GPT-5-Codex比GPT-5少用了93.7%的计算资源。面对复杂任务，它会投入约两倍的时间进行深度推理、代码编辑、测试和迭代。这种机制使得模型在日常小问题上不磨蹭，在大项目上则能投入足够时间深度处理。OpenAI的Codex产品负责人Alexander Embiricos解释道：“这比路由机制更具优势”，后者一开始就必须决定分配多少算力和时间，而GPT-5-Codex可以在处理任务5分钟后决定“还需要再多花一个小时”。

02 全面性能提升：基准测试表现卓越

在性能方面，GPT-5-Codex在两项关键测试中的表现优于普通GPT-5模型。在SWE-bench Verified（n=500）基准测试中，GPT-5-Codex的准确率达到74.5%，超越了GPT-5的72.8%。在代码重构任务上，性能提升更为显著，准确率从33.9%大幅跃升至51.3%。这些任务涵盖Python、Go、OCaml等语言。一个典型例子是，GPT-5-Codex成功处理了一个来自Gitea的Pull Request，该任务需要修改232个文件和3541行代码，将ctx变量贯穿到应用逻辑中。

03 代码审查：更少错误，更多高价值建议

GPT-5-Codex经过代码审查任务的专项训练，能够提供更少错误意见和更多高影响力建议。评估结果显示，GPT-5-Codex提出的不正确评论比例从13.7%骤降至4.4%。同时，其提出的高影响力评论比例从39.4%提升至52.4%。它平均每个PR提出的评论数也从1.32降至0.93，表明它更专注于提出关键、有价值的建议，避免了信息过载。OpenAI内部已经将Codex集成到代码审查流程中，每天能发现数百个问题，很多时候比人工审查更早发现潜在bug。

04 生态工具全面升级

为使Codex成为更出色的编程伙伴，其整个生态系统也获得了全面更新。全新改造的Codex CLI现已围绕自主编程流程重构，支持直接附加和分享图片（包括截图、线框图和架构图），用于建立对设计决策的共同理解。Codex IDE插件支持VS Code、Cursor等编辑器，让用户能无缝预览本地修改并与Codex协作编辑代码。插件还支持在云端与本地环境间流畅切换。云端基础设施也有明显改进，通过容器缓存将新任务和后续任务的中位完成时间缩短了90%。Codex能自动设置运行环境，扫描常见初始化脚本并执行，按需安装依赖。

05 多环境访问与安全措施

GPT-5-Codex已开始在Codex系列产品中逐步推出，用户可通过终端、IDE、GitHub或ChatGPT访问。所有ChatGPT付费用户均可使用这一新模型。OpenAI计划未来向API客户开放该模型。安全方面，OpenAI采用了沙箱运行环境，默认禁用网络访问，确保不会在用户电脑上执行有害操作。开发者可以根据风险承受度自定义安全设置。与GPT-5管理方式一致，GPT-5-Codex在生物与化学领域被归类为高能力模型，已采取相应安全措施。

06 实际应用效果与用户反馈

早期使用者反馈显示，Codex正在改变开发工作流程。Duolingo高级软件工程师Aaron Wang表示，Codex在后端代码审查中超越了其他工具，能发现兼容性问题和其他工具遗漏的缺陷。在Cisco Meraki，技术主管Tres Wong-Godfrey借助Codex完成了另一团队代码库的复杂重构工作。这不仅使他能更专注于其他优先事项，Codex还交付了经过充分测试的高质量代码。OpenAI首席执行官萨姆·奥特曼在社交平台上透露，GPT-5-Codex已经占到Codex流量的40%，“今天某个时候应该能占到多数”。

GPT-5-Codex现已全面集成于OpenAI的付费订阅服务中。所有ChatGPT付费用户，包括Plus、Pro、Business、Edu和Enterprise套餐的订阅者，均可使用该模型。开发者反馈显示，这个新型编程助手能够对小事情处理迅速，在重要的时候努力工作，生成的代码质量有显著提升。未来几周，随着更多开发者体验这一工具，AI辅助编程可能迎来新的革命。

分享到：

极致算力破局：戴尔第 17 代 PowerEdge 服务器重构数据中心能效与弹性

 2025-07-18
南洋理工与北大合作推出开源长记忆世界模型WORLDMEM，提升虚拟场景一致性

 2025-07-23
杭州灵伴科技向文杰：元宇宙能为工业带来什么？

 2022-11-01
勇气的赞歌：一文读懂2022年诺贝尔生理学或医学奖

 2022-11-01
即时零售“黄金窗口期”：品牌如何“快准狠”起跑万亿赛道？

 2025-08-28
重磅官宣 | 商旅领航企业恒顺商旅亮相CDIE2025，助力企业降本增效！

 2025-03-14

热门标签

极致算力破局：戴尔第 17 代 PowerEdge 服务器重构数据中心能效与弹性

南洋理工与北大合作推出开源长记忆世界模型WORLDMEM，提升虚拟场景一致性

杭州灵伴科技向文杰：元宇宙能为工业带来什么？

勇气的赞歌：一文读懂2022年诺贝尔生理学或医学奖

即时零售“黄金窗口期”：品牌如何“快准狠”起跑万亿赛道？

重磅官宣 | 商旅领航企业恒顺商旅亮相CDIE2025，助力企业降本增效！

Trae2.0重磅发布—一个具备上下文工程能力的系统

AI 提示词管理工具 AI Gist 正式上线

物流机器人时代要来了？！

字节跳动 AI 编程工具 TRAE 2.0 即将发布，新增语音交互功能

AI导游重塑文旅及物流消费体验

魔镜洞察

拜特科技

奇墨科技

致远互联

滴普科技

关于Tech技术加

快速导航

热门推荐

关注我们

微信在线客服

电话： +86 15618587198