

封面新闻记者 吴雨佳
随着模型能力的持续突破,AI视频生成正从“工具属性”走向“创作基础设施”,推动视听行业进入全新的生产阶段。4月15日,在第十三届中国网络视听大会新技术新场景论坛上,可灵AI产品及运营负责人温园旭发表题为《技术升维·创作无界 可灵AI赋能视听新生态》的主题演讲,系统阐述了可灵AI在多模态技术演进、创作能力升级及产业落地方面的最新进展
在技术层面,温园旭介绍,可灵AI已实现图像生成、视频生成、音频生成三大核心能力的深度融合,构建起统一的多模态视频模型体系。通过近两年的迭代,模型在角色一致性、镜头调度、音画同步及多主体音色绑定等方面实现显著提升,使AI从“生成画面”走向“理解故事”。同时,动作控制能力的升级让数字角色具备接近专业动作捕捉的表现力。
谈及产业落地,温园旭指出,可灵AI已完成从单一生成工具向全流程AI创意工作台的转型,系统解决了以往AI创作中功能分散、生成等待、效果不可控及协作困难等问题。目前平台已覆盖从素材生成到完整创作流程的各个环节,支持从个人创作到团队协作的多场景需求。
数据显示,可灵AI已服务超过6000万创作者,累计生成视频突破6亿条,服务超过3万家企业用户。在具体应用上,已形成覆盖视听创作全流程的四大核心场景:前期概念开发与提案沟通、预演与风险前置、视效替代与镜头补完,以及角色驱动内容与IP扩展。
温园旭列举了多个落地案例:在影视领域参与《太平年》、《大卫之家》等项目制作;广告营销方面助力美团愚人节广告《麻烦死了》在两周内完成制作;文旅场景中与河南广电合作“何以唐宫夜宴”项目,通过AI技术激活传统文化表达。
面向未来恒指配资开户,温园旭表示,可灵AI将持续围绕多模态大一统模型、原生叙事能力与精准动作控制等方向突破,拓展AI在视听创作中的表达边界。他强调:“技术在升维,创作无边界。AI的终极使命不是取代创作,而是让更多人拥有表达的能力。”随着技术与创作的深度融合,一个“人人皆可导演”的时代正在到来。
华林优配提示:文章来自网络,不代表本站观点。