热门资讯> 正文
2025-10-17 17:10
10月15日,视频生成模型百度蒸汽机再次升级,首次实现AI长视频实时交互生成。该功能升级依托流式视频技术实现“无限时长”生成,突破传统AI视频生成10秒左右的时长限制。
据悉,用户只需上传单张图片与一段提示词即可启动视频生成流程,并能实时预览模型推理全部内容。百度副总裁、移动生态商业体系负责人陈一凡在发布会现场演示了这一操作过程。可以看到,在视频生成过程中,用户可随时暂停、或在任意节点修改提示词,实现对视频剧情、画面、转场的实时控制,全程干预。这意味着,AI视频正从“单向生成”迈向“双向共创”,实现“无限画布”式的连续创作体验。
此外,此次升级同步推出了可交互数字人与开放世界动态构建两大功能。数字人支持沉浸式双向互动,可应用于AI导购、教育、陪伴等场景;开放世界则允许用户通过自行操控,在AI生成的游戏地图、旅游景点、宇宙空间等环境中自由探索。
今年以来,AI视频生成赛道的竞争越发白热化。今年5月,谷歌发布Veo 3,一度刷屏并占据文生视频模型榜首。10月初,OpenAI推出的Sora 2再次抢占行业风头,同步推出的Sora App也成为AI应用的新热门,在推出后的一周内就获得了62.7万iOS下载量,这一数据已经超越了ChatGPT当初的表现。
陈一凡认为,AI视频竞争的下半场,正在从技术比拼转向门槛之争,谁能让更多人更低成本地参与创作,谁就能在生态中积累更大的优势。对于近期业界热议的Sora 2,陈一凡认为,其底层模型在一致性和运镜丰富度上有所提升,但尚未达到基础模型级别的突破。
据悉,百度蒸汽机自5月以来持续迭代,先后实现音视频一体化生成、多人对话生成、移动端适配等能力。本次长视频实时交互功能的推出,进一步拓展了AI视频在影视预演、互动娱乐、个性化营销等场景的应用边界。
百度方面透露,目前营销相关和内容创作是百度蒸汽机调用量最大的两大落地场景,营销相关调用量占到约一半。预计随着技术不断成熟,蒸汽机将为影视行业带来更多创新突破。
“目前AI还不能完全代替传统影视制作,但是已经能在很多环节节省人力成本了,比如剪辑制作。Sora肯定会推动整个行业的发展,我们也在影视动漫上有了很多应用和落地,期待能一起推动整个创作行业的发展,让更多人发挥创意、成为创作者。”陈一凡表示。撰文/陈佳靖