谷歌發佈VEO3.1，讓AI視頻更接近大片效果

2025-10-16 10:49

在AI視頻生成競爭進入「精細創作」階段之際，以及Sora App的大火，Google不得不再次出手。

今日，Google DeepMind與Google Labs 聯合宣佈推出 Veo 3.1，其最新一代AI視頻生成模型，併爲AI創作平臺 Flow 帶來重大升級：全面引入音頻生成、鏡頭編輯與物體插入、刪除功能，賦予用户真正的「導演級控制權」。

據官方介紹，自Flow推出以來，已生成超過 2.75億條視頻，Veo 3.1的到來意味着AI視頻製作從「能拍」進入「能導」的新階段。

與前代Veo 3相比，Veo 3.1在三個維度實現突破：

全鏈路音頻生成：支持「Ingredients to Video」「Frames to Video」「Extend」等功能的同步音效生成；

更強敍事控制力：可通過首尾幀、參考圖像精確定義鏡頭節奏與故事走向；

更真實的質感還原：強化光影、材質、動作細節，整體逼真度顯著提升。

Google DeepMind產品經理 Jess Gallegos 表示：

「Veo 3.1帶來了音畫統一的敍事能力，讓創作者第一次能在AI視頻中‘講故事’，而不僅是‘做片段’。」

Google將Veo 3.1強大的視頻模型全面接入Flow平臺，使創作者能夠像剪輯師一樣編輯AI視頻。

音頻全面融入視頻生成

Veo 3.1可為每個場景自動生成擬合音效與環境聲，包括風聲、水聲、腳步聲與背景配樂。這讓AI視頻首次具備「情感維度」，實現真正的視聽同步敍事。

Ingredients to Video：可同時導入多張參考圖像，精準控制角色、風格、場景與光影。

Frames to Video：輸入首尾幀，AI自動生成中間鏡頭，實現自然過渡或藝術化轉場。

Extend：基於上一個片段的最后一秒，生成連貫續拍，實現分鍾級長鏡頭效果。

AI「視頻修圖」：插入與刪除新功能

Google首次在Flow中引入視頻級「修圖」功能：

Insert：可添加任意元素，從人物、物體到奇幻生物，AI自動匹配陰影與光線，使其自然融入畫面。

Remove（即將上線）：用户可直接刪除畫面中的角色或物件，AI將重建背景，讓「刪除無痕」。

這意味着，AI創作從「一次性生成」邁向「反覆編輯」，讓視頻製作更接近專業后期。

無縫銜接Gemini與Vertex生態

Veo 3.1同步接入 Gemini API 與 Vertex AI，企業和開發者可在應用中直接調用這套生成體系。這不僅讓Flow成為創作者平臺，也讓Veo 3.1成為Google AI生態的底層視頻引擎。

應用場景：AI從「視頻生成」走向「視頻導演」：

創作者：可用參考圖像+音頻腳本構建完整短片；

媒體機構：在新聞或紀錄片製作中生成過渡鏡頭與背景音；

遊戲公司：快速生成敍事動畫、CG預告片；

教育與廣告行業：一鍵創建定製化、場景化教學視頻與產品短片。

與OpenAI的Sora主打端到端生成不同，Google的Veo 3.1+Flow路徑更像是一個「AI創意工作臺」：

Sora = AI攝影機（輸入文字→輸出視頻）

Veo 3.1 + Flow = AI剪輯台 + 調色師 + 音效師

這種「模塊化創作」讓Flow不僅是AI視頻工具，更像是下一代Adobe Premiere + Midjourney的混合體。

Flow現在不只是AI視頻工廠，更是AI版《好萊塢導演訓練營》。Sora讓你能拍，Veo讓你能導。AI的下一個戰場，是誰能講好故事。（轉自AI普瑞斯）

更多AI資訊請點擊：http://www.aipress.com.cn/