人工智能的进化方向,正从“动动嘴”向“动动手”发生质的飞跃。2026年2月26日,在三星Galaxy Unpacked发布会上,谷歌与三星联合投下了一枚重磅炸弹:Gemini正式进化为具备执行能力的“具身智能体”,让手机从“问答助手”彻底变成了能跑腿办事的“小弟” 。
这意味着,Gemini不再只是一个对话机器人,而是一个能够理解上下文、自主规划并跨应用执行复杂任务的数字代理。首批支持该功能的设备为谷歌Pixel 10系列和三星Galaxy S26系列,目前在美国和韩国率先推出预览版 。
一句话,让手机替你“搞定”
此次升级最核心的变化,是赋予了手机真正的“动手能力”。用户只需长按侧边电源键唤醒Gemini,用一句自然语言下达指令,AI便能在后台自动完成以往需要手动切换多个App才能搞定的繁琐任务 。
在发布会现场,谷歌安卓生态系统总裁萨米尔·萨马特展示了一个极具生活气息的场景:面对家庭群聊里七嘴八舌讨论披萨订单的消息,萨马特直接对Gemini说:“帮我处理群聊里的披萨订单。”接下来的一幕堪称魔法:Gemini自动读取群聊内容,分析每个人的口味偏好,启动外卖应用,导航到对应餐厅,将所有披萨添加到购物车,最后生成订单等待用户确认 。
“行业内称之为智能体AI,”萨马特解释道,“我只把它叫做——把事情搞定。”
除了订外卖,Gemini还能在Uber上自动叫车,只需告诉它目的地,AI就会在虚拟窗口中打开应用完成选择,并在提交订单前提醒用户确认 。目前,该功能首批覆盖出行打车(如Uber)、餐饮外卖(如DoorDash、Grubhub)和生鲜杂货配送三大场景 。
技术揭秘:虚拟沙箱与双轨方案
为了让AI“放手办事”的同时确保安全,谷歌在底层技术上做了精密布局。
当用户下达任务指令后,Gemini会在手机上启动一个独立的“安全虚拟窗口”来运行目标应用,而非直接控制用户的主界面。这个隔离的“沙箱”环境,既保证了任务流畅执行,又避免了AI触及手机内的其他隐私数据 。
在操作方式上,谷歌采用了AppFunctions与UI自动化双轨并行的方案。一方面,通过名为“AppFunctions”的底层框架,允许开发者公开应用的功能接口,让Gemini能够精准调用;另一方面,Gemini 3具备强大的多模态视觉理解能力,能够像人类一样“看懂”应用界面、识别按钮并模拟点击,即使应用没有提前适配,也能通过视觉识别完成任务 。
此外,用户拥有全程的控制权:所有自动化任务必须由用户主动开启,系统运行过程中用户可随时通过通知查看进度或终止任务,涉及支付等敏感操作时,系统会提示用户手动完成 。
首批机型:顶级旗舰的专属福利
由于该功能涉及复杂的系统级交互,目前对硬件有一定要求,首批仅限谷歌Pixel 10/10 Pro以及三星Galaxy S26系列支持,初期在美国和韩国推出 。
值得注意的是,这并非手机厂商的孤立尝试。就在三个月前,字节跳动的“豆包手机助手”以几乎相同的理念惊艳亮相,证明了系统级AI智能体的可行性 。而随着谷歌的正式入场,这一赛道已被彻底点燃。今年1月,苹果也确认将采用Gemini驱动下一代Apple Intelligence功能,这意味着Gemini有望同时成为安卓和iOS两大平台的AI底座 。
三星方面披露,其Galaxy AI已覆盖全球4亿台设备,与谷歌合作后,预计今年搭载Gemini的设备数量将翻倍至8亿台 。根据IDC预测,2026年中国新一代AI手机出货量将达1.47亿台,占据整体市场的半壁江山 。
从操作系统到智能系统
“安卓正从传统操作系统演变为一个真正理解并为你服务的智能系统。”萨马特如此定义这次升级的意义 。当手机不再是冷冰冰的工具,而是一个能主动思考、代为操办的智能伙伴,我们或许正站在移动互联网下一幕的门槛上。
目前,Gemini智能体功能已以Beta预览版形式向Galaxy S26系列和Pixel 10系列用户开放,首发市场为美国和韩国 。这场由谷歌引领的“手机跑腿”革命,才刚刚开始。