近日,可灵AI正式推出3.0版本,在全球范围内首次引入“主体参考”技术,支持生成长达15秒的连贯视频内容。这一突破被业界视为AI从“工具助手”迈向“创意导演”的关键一步,或将重新定义短视频、广告乃至影视创作的生产方式。
技术核心:让AI学会“聚焦主角”
此次升级最引人注目的创新是“主体参考”功能。该技术允许用户在生成视频时设定一个需要持续保持识别与连贯性的主体——可以是人物、动物或特定物体。AI会在视频全程跟踪该主体,确保其外观、动作在不同帧之间自然衔接,有效解决了此前AI生成视频中常见的角色突变、抖动断裂等问题。
“这就像是给AI配备了一名虚拟摄影师,始终将镜头焦点锁定在主人公身上。”技术负责人解释道。通过多模态感知与动态建模的结合,系统能理解主体在不同场景、动作下的合理演变逻辑,而非简单拼接图像。
15秒突破:从“瞬间碎片”到“叙事单元”
此前,多数AI视频生成工具限于3-5秒的时长,难以承载完整叙事。可灵AI 3.0将生成长度扩展至15秒,使得AI能够呈现一个包含起承转合的微场景:比如一只猫跳上书架、碰倒花瓶、落地逃跑的全过程,或人物从推门进入至坐下交谈的连贯动作。
这一突破得益于动态物理引擎与时空一致性算法的升级。系统不仅能预测物体运动轨迹,还能模拟光影变化、背景与主体的交互关系,让生成的视频在时间维度上更具可信度。
行业影响:降低创作门槛,激发新表达形式
可灵AI 3.0的发布迅速引发创意行业关注。广告制片人李薇表示:“过去用AI做创意提案,往往只能展示分镜片段。现在15秒的连贯视频已经能传递完整的创意概念,甚至可直接用于社交媒体投放。”
教育、科普领域也看好其应用前景。教师可通过描述生成历史场景或科学实验的模拟视频;自媒体创作者无需拍摄便能实现多种视觉创意。同时,该技术也为小型工作室甚至个人创作者提供了接近专业级制作的可能。
谨慎期待:AI导演时代刚刚启程
尽管技术进步显著,但行业专家也指出,目前AI生成视频在复杂叙事、细腻情感表达等方面仍有局限。15秒视频中若涉及多人互动或快速场景切换,仍可能出现逻辑瑕疵。此外,版权与伦理问题——例如AI生成内容中涉及真人相似度或艺术风格模仿——也需要进一步规范。
可灵团队表示,此次开放的是面向公众的体验版本,未来将与企业及创作者合作,在影视预演、虚拟拍摄辅助等场景进行深度探索。“我们并非要取代人类导演,而是希望将人从重复性劳动中解放,更聚焦于故事与情感的核心。”
随着可灵AI 3.0的发布,AI视频生成领域正式迈入“长视频、强连贯”的新阶段。当技术逐渐理解“主体”与“叙事”,人机协作的创作图景也正在打开新的想象——或许不久的将来,每个人都能拥有一名懂得聚焦故事主角的“AI导演助手”