繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

谷歌全新Gemini Omni首曝,視頻版「香蕉」來了,教授黑板推公式全對

2026-05-12 10:36

谷歌I/O大會開幕在即,原生Gemini提前曝光!

如今,全網都被這個視頻刷爆了——

一位教授在臺上一邊講課,一邊在黑板上隨手推導公式,這質感、絲滑度,堪稱驚艷。

實際上,這是由「全新視頻模型」Gemini Omni生成,連貫性、一致性直接拉滿。

有網友驚歎道,視頻版Nano Banana來了!

還有人表示,眼見為實已經不存在了。

原生Gemini Omni,首次曝光了

就在昨天,Gemini移動端App主頁截圖流出,一個全新視頻模型Gemini Omni入口上線。

界面中,赫然寫着——

快來認識一下我們全新的視頻生成模型。重新混剪你的視頻,直接在對話中編輯,嘗試模板。

顯然,谷歌以全新形式帶來了Gemini Omni!

這可能是一個全模態的Gemini,同時支持文本、圖像、音頻、視頻輸入和輸出。

與Veo不同的是,Omni將像Nano Banana一樣深度集成到Gemini中,具備更出色的提示理解與推理能力。

尤其是,在實時視頻編輯上,可以一鍵物體替換,去除水印。

與此同時,Omni模型的ID也被同時爆出——

fbard_eac_video_generation_omni /bard/v3smm-lora-prod.goat-cr-rev6-xm171555416-at-1200

可見,Omni生成的視頻支持10s時長,分辨率1280x720。

真正讓全網陷入瘋狂的是,幾個提前測試放出的demo。

教授黑板推公式,全網震驚

最炸裂的那個一,便是開篇「教授在黑板上推導三角恆等式」的視頻。

畫面中,教授手持粉筆在黑板上一步一步寫下數學證明,同時用口語同步講解當前推導步驟。

懂行的人看到這會直接跳起來。在AI生成視頻里把數學公式寫對,這件事有多難?

文本一致性一直是視頻生成模型的「阿喀琉斯之踵」。

此前,Sora生成的文字經常是看着像字,但仔細一看全是「鬼畫符」的狀態,更別提完整的數學推導了。

而Omni的這段demo,公式是對的,推導是連貫的,筆跡是自然的。

更難以想象的是,這個驚艷的demo,僅用了一句提示詞——

A professor writes out a mathematical proof for trigonometric identities on a traditional chalkboard, explaining the step he is currently on in the equation.

許多人看完,直接破防!

不得不説,AI視頻生成已跨越「恐怖谷」,正式進入超寫實時代。

還有灰度到的網友,也做了一批類似的視頻,個個都好到爆。

真正的殺手鐗:實時編輯

Gemini Omni強大之處不止於生成,這一次,「實時編輯」也實現了大幅跨越。

泄露的演示中,Omni展現了令人瞠目的編輯能力——

  • 一鍵去水印:Omni可以直接對話去水印,且畫面毫無破綻;
  • 物體替換: 動動嘴,視頻中的物體就被精準替換,光影、遮擋關係全部自動適配;

再比如,上傳一個Sora之前生成的視頻,Gemini Omni可以直接去除水印。

有人對此表示,僅是去水印這一點,足以讓這一工具成為創作者的遊戲規則改變者。

不僅如此,Gemini Omni還可以支持風格化輸出。

下面這個動漫風格的視頻,藍色火焰特效、打鬥動作線條,每一幀都像是專業動畫師手繪的。

視頻截圖

不過早期測試顯示,Gemini Omni額度消耗非常快。

谷歌殺回,Sora 2卻關停了

Gemini Omni泄露的時間點,堪稱「精準卡位」。

就在兩周前——4月26日,OpenAI的Sora App正式停服。

這個曾經讓全世界為之瘋狂的AI視頻生成器,走完了它短暫而戲劇化的一生。

回顧一下Sora的死因,簡直是一部商業悲劇:

燒錢速度驚人,據稱,Sora的推理成本高達每天100萬到1500萬美元。視頻生成比文本和圖像生成貴了不止一個量級,而這個成本始終沒降下來。

最關鍵的是,OpenAI留不住用户。峰值約100萬活躍用户,到停服前已跌破50萬,30天留存率不到8%。

整個生命周期的應用內收入僅約210萬美元,連一天的算力費都覆蓋不了。

3月24日,Sora官方賬號在X上發出那句著名的告別,「We're saying goodbye to the Sora app」。

API將在9月24日徹底關閉,一個時代結束了。

谷歌I/O 2026將在5月19日開幕,Gemini Omni極有可能在主舞臺上正式亮相。

AI視頻賽道,又要變天了。

有網友將Omni生成的視頻,和Sora 2做了一個直觀對比,效果簡直差出好幾個量級。

動漫打鬥場景中,Gemini Omini絲滑到炸裂,Sora特效卻一團亂麻。

I/O倒計時,谷歌攤牌

除了Omni,谷歌多款尚未正式發佈的Gemini「全線模型」被意外推送到生產環境API中。

此次泄露的模型陣容極其豪華,包括Gemini 3 Flash、3.1全系列(Pro、Flash Image、Lite、TTS),以及專注於高保真音頻生成的Lyria 3 Pro。

最重磅的是,谷歌即將推出的「Omni」原生多模態視頻模型,將針對所有的核心模型推出專門的Agent版本。

I/O主舞臺,谷歌要攤牌了!

參考資料:

https://x.com/chetaslua/status/2053824398503678108?s=20

https://x.com/testingcatalog/status/2053857806374064496?s=20

https://x.com/Waguri_Kaoruko8/status/2053818116237353039?s=20

https://www.reddit.com/r/singularity/comments/1ta99ss/upcoming_leaked_gemini_omni_vs_nearly_shutting/

本文來自微信公眾號「新智元」,作者:新智元,編輯:桃子 好睏,36氪經授權發佈。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。