“你的电脑正在自主运行测试、寻找Bug,而你人在千里之外喝咖啡。”
这不是科幻电影。5月29日,OpenAI正式宣布Codex迎来重大升级——自主“计算机使用”(Computer Use)功能正式登陆Windows 11,同时手机远程控制打通全平台。这意味着全球开发者第一次拥有了能真正“离开人”的AI编程与测试助理。

此次更新最核心的功能是Codex获得了类似人类的图形界面交互能力。OpenAI为Windows 11的Codex应用(版本26.527)加入了“计算机使用”模式,AI能够主动看屏幕、点击界面元素、在输入框中键入文字,并直接操控本地应用程序、文件和开发工具。
在功能设置中打开“计算机使用”开关后,开发者可以用“@computer”命令让Codex接管整个桌面,或通过“@Paint”等指令将其限定在单个应用内。从在画图中绘制一幅图片,到录制一段视频并保存,再到在一个完整的编码流程中验证软件界面——Codex都能独立完成,全程无需人工值守。
最具生产力价值的是后台运行能力。开发者只需要在Codex里启动一个测试任务,比如“帮我跑一遍用户登录流程、检查所有前端页面断点”,然后就可以离开电脑。Codex会自己执行、排查问题,并将测试结果和截图记录下来,等待开发者后续审阅。
如果把桌面端的“计算机使用”比作Codex的“手脚”,那么此次与ChatGPT应用的深度整合,就是给了它一套远程指挥系统。
现在,用户可以通过iPhone或安卓设备上的ChatGPT应用,远程连接到运行Codex的Windows PC,随时随地发起工作、实时管理任务,所有状态变更、截图和终端日志都会同步到手机上。Codex在后台运行时,如果遇到用户关键授权节点,会自动暂停,直到开发者通过手机批准后继续。OpenAI在底层通过安全中转传输机制,确保设备间连通的安全性,无需将设备直接暴露在公网。
这款跨越桌面与移动的操作界面,将编程、测试和应用的运行链路彻底打通。Codex的这套“数字员工”体系从今年4月上线Mac版本,到5月中打通手机远程控制iOS/安卓,再到5月底全面整合Windows,完成了在一个多月时间里对主流开发者生态的三级跳。
这并非一个简单的版本迭代,而是OpenAI把Codex从一个“开发工具”升级为跨平台AI大脑的关键步骤。
在微软的Windows生态中,Codex正在实现唯一能够真正验证真实桌面用户体验的AI编程助手的能力,这使其与偏重命令行集成的Claude Code形成了明显的差异化。更宏观的是,OpenAI计划将ChatGPT、Codex和Atlas浏览器整合为一个统一的桌面超级应用,打造成覆盖工作与生活的AI一站式入口。
随着Codex获得在Windows上如同真人一样点击、视觉、敲字、执行长周期任务的能力,再加上手机端随时管理和授权的协同体验,AI的“使用边界”正从原本单一的对话生成,全面融入真实的生产执行体系。
在生产力链条上,你不再是一个孤独的程序员,而是一个随时出差、却拥有一个勤勉不辍的数字分身的企业主。 行业分析指出,Window的用户场景覆盖了这个星球上最广泛的一线开发和业务流程人员,允许AI在没有物理限制的前提下进行手动任务替换。从商业模式来看,这种大幅提效的工具在企业级的落地极有可能催生稳定的订阅模式或后端AI使用权付费。
在赋予AI“视觉”和“操控权”的强大同时,安全问题自然浮上水面。计算机使用功能上线之前,OpenAI已经设计了健全的安全机制。当Codex首次尝试访问一个应用时,它会先向用户请求许可。执行任务期间,AI的活动范围严格限制在用户明确允许的应用程序中,用户永远不会失去监督和控制权。这种精心设计的“护栏”,意在防止任何潜在的越权行为,降低AI与操作系统直接互动时的风险。
从本月刚刚在微软Build大会上推出Win32自动化,到如今整合手机远程与计算机自主运行,OpenAI仅用不到一个月的时间,就让Codex从一个对话式编码助手,蜕变为一个能自主掌控操作系统的多平台智能体。正如OpenAI的官方表态: “Codex now supports more of the Windows developer loop.” 支持Windows开发者的整个循环,意味着一个永远不下班的AI员工正在上岗。