熱門資訊> 正文
2025-10-16 10:49
在AI視頻生成競爭進入「精細創作」階段之際,以及Sora App的大火,Google不得不再次出手。
今日,Google DeepMind與Google Labs 聯合宣佈推出 Veo 3.1,其最新一代AI視頻生成模型,併爲AI創作平臺 Flow 帶來重大升級:全面引入音頻生成、鏡頭編輯與物體插入、刪除功能,賦予用户真正的「導演級控制權」。
據官方介紹,自Flow推出以來,已生成超過 2.75億條視頻,Veo 3.1的到來意味着AI視頻製作從「能拍」進入「能導」的新階段。
與前代Veo 3相比,Veo 3.1在三個維度實現突破:
全鏈路音頻生成:支持「Ingredients to Video」「Frames to Video」「Extend」等功能的同步音效生成;
更強敍事控制力:可通過首尾幀、參考圖像精確定義鏡頭節奏與故事走向;
更真實的質感還原:強化光影、材質、動作細節,整體逼真度顯著提升。
Google DeepMind產品經理 Jess Gallegos 表示:
「Veo 3.1帶來了音畫統一的敍事能力,讓創作者第一次能在AI視頻中‘講故事’,而不僅是‘做片段’。」
Google將Veo 3.1強大的視頻模型全面接入Flow平臺,使創作者能夠像剪輯師一樣編輯AI視頻。
音頻全面融入視頻生成
Veo 3.1可為每個場景自動生成擬合音效與環境聲,包括風聲、水聲、腳步聲與背景配樂。這讓AI視頻首次具備「情感維度」,實現真正的視聽同步敍事。
Ingredients to Video:可同時導入多張參考圖像,精準控制角色、風格、場景與光影。
Frames to Video:輸入首尾幀,AI自動生成中間鏡頭,實現自然過渡或藝術化轉場。
Extend:基於上一個片段的最后一秒,生成連貫續拍,實現分鍾級長鏡頭效果。
AI「視頻修圖」:插入與刪除新功能
Google首次在Flow中引入視頻級「修圖」功能:
Insert:可添加任意元素,從人物、物體到奇幻生物,AI自動匹配陰影與光線,使其自然融入畫面。
Remove(即將上線):用户可直接刪除畫面中的角色或物件,AI將重建背景,讓「刪除無痕」。
這意味着,AI創作從「一次性生成」邁向「反覆編輯」,讓視頻製作更接近專業后期。
無縫銜接Gemini與Vertex生態
Veo 3.1同步接入 Gemini API 與 Vertex AI,企業和開發者可在應用中直接調用這套生成體系。這不僅讓Flow成為創作者平臺,也讓Veo 3.1成為Google AI生態的底層視頻引擎。
應用場景:AI從「視頻生成」走向「視頻導演」:
創作者:可用參考圖像+音頻腳本構建完整短片;
媒體機構:在新聞或紀錄片製作中生成過渡鏡頭與背景音;
遊戲公司:快速生成敍事動畫、CG預告片;
教育與廣告行業:一鍵創建定製化、場景化教學視頻與產品短片。
與OpenAI的Sora主打端到端生成不同,Google的Veo 3.1+Flow路徑更像是一個「AI創意工作臺」:
Sora = AI攝影機(輸入文字→輸出視頻)
Veo 3.1 + Flow = AI剪輯台 + 調色師 + 音效師
這種「模塊化創作」讓Flow不僅是AI視頻工具,更像是下一代Adobe Premiere + Midjourney的混合體。
Flow現在不只是AI視頻工廠,更是AI版《好萊塢導演訓練營》。Sora讓你能拍,Veo讓你能導。AI的下一個戰場,是誰能講好故事。(轉自AI普瑞斯)
更多AI資訊請點擊:http://www.aipress.com.cn/