2025年11月18日,蚂蚁集团在AI领域投下一枚“重磅炸弹”——全模态通用AI助手“灵光”正式上线安卓与苹果应用商店。这款以“自然语言30秒生成小应用”为核心亮点的产品,不仅开创了移动端AI编程的先河,更通过全代码生成多模态内容的能力,重新定义了通用型AI助手的生产力边界。
三大核心功能:从对话到创作,覆盖全场景需求
灵光首批上线三大功能模块——“灵光对话”“灵光闪应用”“灵光开眼”,形成从信息交互到工具生成、再到视觉创作的完整闭环:
灵光对话:让知识“秒懂”
突破传统文字问答模式,通过结构化思维引擎将复杂信息转化为逻辑清晰的呈现方案。例如,用户询问物理原理时,系统会分解知识点层次,并自动生成3D实验动图与可操作数据表格,将抽象概念转化为直观体验。在教育场景中,这一功能可生成3D实物动图、交互式示意表格,让复杂信息一目了然。
灵光闪应用:30秒生成个性化工具
用户仅需输入一句话需求,即可在30秒至1分钟内生成完整AI应用。例如:
烹饪场景:输入“溏心蛋要煮多久?”,系统生成参数可调的“溏心蛋时间计算器”,用户可自定义鸡蛋大小与熟度等级;
养车场景:输入“怎样养车最划算?”,系统创建成本计算模型,根据里程、油耗等变量生成个性化方案;
健身场景:输入“帮我制定一周健身计划”,系统生成包含动作演示视频、卡路里计算器的动态工具。
这些应用并非静态页面,而是集成后端模型能力的动态工具,支持实时数据交互与场景延伸。
灵光开眼:物理世界的智能解析与再创作
搭载AGI相机技术,通过实时视频流解析实现物理世界的观察与理解。例如:
旅游场景:拍摄古建筑时,系统即时生成结构解析图与历史背景说明;
创作场景:将文字描述转化为动态视频素材,支持文生图、图生视频等跨模态创作;
生活场景:识别路边植物、潮流单品,并提供“为什么”“怎么用”等延展知识。
技术突破:多智能体协作架构支撑全模态生成
灵光的核心竞争力源于其多智能体协作的Agentic系统。该架构通过动态调度图像、3D、动画等专用模块,实现多模态内容的协同生成。例如:
生成旅行规划应用时,系统同步调用地图Agent、日程Agent与预算Agent,确保方案兼具路线合理性与成本可控性;
生成健康食谱时,系统联动营养分析Agent与食材采购Agent,提供从菜谱到采购清单的一站式服务。
此外,灵光是业内首个全代码生成多模态内容的AI助手,所有呈现结果(如图表、动画、小应用组件)均由模型根据对话情境即时生成,而非调用预设模板。这一能力使其在信息呈现的丰富度与个性化上远超传统AI工具。
战略意义:蚂蚁AGI生态的关键一环
灵光的推出标志着蚂蚁集团在通用人工智能领域从技术突破向场景落地的关键跨越。2025年以来,蚂蚁已构建起覆盖医疗、具身智能、大模型等领域的AGI矩阵:
AI医疗管家AQ:专注健康咨询与疾病预测;
具身智能灵波科技:探索机器人与物理世界交互;
百灵大模型:跻身万亿参数阵营,支撑底层算力需求;
灵光:作为前端交互入口,将AI能力渗透至日常生活场景。
蚂蚁集团相关负责人表示:“灵光的核心理念是‘让复杂变简单’。通过将应用开发嵌入日常对话,我们希望降低AI使用门槛,让每个人都能享受技术红利。”
行业影响:开启全民AI编程时代
灵光的上线或将引发AI应用市场的格局重构。传统AI工具多聚焦单一功能(如文本生成、图像生成),而灵光通过“对话即开发”的模式,将应用生成能力赋予普通用户。据实测,其生成的应用已覆盖健身、旅行、健康、教育等20余个生活场景,且支持一键分享至社交平台,形成“生成-使用-传播”的闭环生态。
市场分析人士指出,灵光的竞争优势在于其“端到端”的全链路能力:从理解需求、生成应用,到支持交互与分享,全程无需用户具备编程基础。这一模式若能持续优化,或将推动AI从“专业工具”向“全民基础设施”演进。
目前,灵光已同步登陆安卓与苹果应用商店,用户可免费体验基础功能,付费订阅“SuperGrok”服务则可解锁无限制使用权限。 随着AI技术的持续渗透,这场由灵光引发的生产力革命,或许才刚刚开始。