OpenAI的Sora會砸掉誰的飯碗？

2024-02-18 17:26

不約而同，同日出招。兩個AI巨頭在同一天各自放出了自己的AI新核武器，OpenAI的文生視頻模型Sora又一次贏得了滿堂彩。Sora的驚艷亮相，不僅碾壓了諸多AGI視頻同行，更有可能改變電影電視廣告遊戲行業的未來遊戲規則。

谷歌新模式性能完勝

周四，谷歌突然發佈了新一代多模態大模型Gemini 1.5 Pro，在與OpenAI的大模型之戰中加速超越。這是業界迄今最強的大語言模型，最高可支持10，000KToken上下文，直接將性能提升到了百萬級別，在性能上完全秒殺了OpenAI的GPT-4 Turbo。

百萬級別Token意味着什麼？谷歌AI項目負責人傑夫·迪恩（JeffDean）解釋説，在Gemini 1.5 Pro百萬級別上下文窗口支持能力下，用户可以完成複雜的內容交互，輕松解析整本圖書、電影、播客，理解非常長的文檔，甚至是數百個文件數十萬行的代碼庫。

Gemini 1.5 Pro的發佈，意味着谷歌在和OpenAI的軍備競賽中佔據了強大的性能優勢。相比之下，OpenAI的GPT-4 Turbo只能處理128kToken，而且近期更是出現了性能下滑的不利狀況，直到上個月發佈更新之后纔有所改善。

然而，OpenAI並沒有讓谷歌獨美。就在同一天，他們發佈了文本生成視頻的AI模型Sora，只需文本就能自動生成視頻；繼文本模型ChatGPT和圖片模型Dall-E之后，OpenAI又開始顛覆視頻領域。

相比谷歌Gemini 1.5 Pro基於數據性能的硬實力優勢，Sora基於視覺美學的驚艷表現，顯然更容易讓人印象深刻，迅速成爲了社交網站上的熱點。

以假亂真細節驚艷

Sora到底驚艷在哪里？OpenAI展示了多段Sora製作的視頻內容，光是這些片段，就已經足夠讓人大跌眼鏡。OpenAI在官方博客中寫道，Sora不僅可以理解用户的需求，還知道這些事物在現實世界如何存在。

只需要輸入一段文本，Sora就能自動生成最長一分鍾的高清視頻。令人難以置信的是，Sora不僅可以準確把握用户文本中的複雜意思，並且還能分拆出不同的元素，將其轉換為有具體創意構思的視頻內容，看起來就像是專業導演、攝像和剪輯的作品。

一位戴着墨鏡、穿着皮衣的時尚女子走在雨后夜晚的東京市區街道上，抹了鮮艷脣彩的脣角微微翹起，即便帶着墨鏡也能看到她的微笑，地面的積水映出了她的身影和燈紅酒綠的霓虹燈；熱鬧非凡的唐人街正在進行舞龍表演，熙熙攘攘的人羣目光都聚焦在躍動的彩龍身上，整個環境的喜慶氛圍彷彿令人身臨其境。

與此前的AI視頻存在明顯塑料感不同，此次Sora製作的視頻在逼真度和藝術感方面有着顯著差別：微微卷曲的人物頭發，女人臉上的黑痣粉刺，地面積水倒映的霓虹光影，街頭商販擺賣的諸多食品，天空飄落的櫻花細雪，細節的精細度幾乎已經做到了以假亂真。

更令人驚訝的是，Sora視頻在構圖、色彩、創意和運鏡方面，都呈現出明顯的電影風格，無論是一鏡到底還是多機位都可以無縫切換，甚至還有「演員」的表情神態，這是此前的文生視頻產品所不具備的。OpenAI一出手就將整個AI視頻行業提升了一個級別。

雖然Sora製作的視頻還沒有到完美的地步，仔細看還能看出「穿幫」之處，人物吃過的餅乾甚至會完好無損，但在影像畫質上已經較此前的AI視頻有了質的飛躍，甚至有了電影的質感。而且，僅僅根據一段抽象的文字就能製作類電影的多鏡頭視頻，這種語義理解和鏡頭運用能力更是接近了人類導演、攝像與剪輯的水平。顯然，視頻領域的ChatGPT時刻已經到來。

AI進化速度令人震驚

Sora發佈之后，網絡一片驚歎，幾乎搶盡了Gemini的風頭。AI的進化速度實在令人震驚。要知道，此時距離OpenAI推出ChatGPT，開啟生成式AI時代，僅僅過去了14個月時間。直到去年，我們纔剛剛熟悉文本生成圖片的產品，而僅僅半年前，MidJourney創作的AI圖片里還會出現六指人物。而現在，Sora的視頻就已經讓所有人開始感受到現實和虛擬的界限模糊。

雖然OpenAI的GPT-4 Turbo此前出現了性能下滑和速度變慢的狀況，令人擔心生成式AI的增長遭遇了瓶頸；但Sora的發佈無疑打消了所有人的擔憂。雲計算公司Box創始人兼CEO列維（AaronLevie）在Sora發佈之后感慨説，「如果有人還擔心AI進化速度會變慢的話，我們又一次看到了完全相反的典範。」

目前Sora只面向邀請的製作者和安全專家開放測試，發現和解決可能的安全問題，還沒有宣佈正式的公測時間表。畢竟在虛假信息充斥的互聯網，DeepFake的道德問題也已經成爲了關注焦點，像Sora這樣以假亂真的視頻一旦被濫用，可能會引發災難性后果。

在發佈Sora的幾乎同一時間，OpenAI還完成了一項要約售股交易，並不是融資用於公司用途，而是允許員工向以ThriveCapital牽頭的風投機構出售現有股份套現。值得一提的是，作為OpenAI董事會成員，奧特曼自己並不持有公司股票，估值飆升並不能給他帶來鉅額財富。

此次交易對OpenAI的整體估值達到了800億美元，較之去年年初的300億美元飆升了兩倍多。按照投融資市場調研公司CBInsights統計，OpenAI已經成為全球估值最高的創業公司之一，僅次於字節跳動和SpaceX。

實際上，此次交易本應在去年11月完成，只是因為奧特曼與董事會的衝突風波才被迫擱置。隨着奧特曼重新回到OpenAICEO職位，投資者再次給這家AI巨頭投出了信任票。顯然，在Sora正式發佈之后，OpenAI的估值還會進一步飆升。

巨頭出手碾壓AGI同行

那麼，令人驚艷的文本生視頻Sora究竟會帶來哪些衝擊？

AGI視頻同行無疑是遭受最直接衝擊的。Sora發佈之后，AI視頻創業公司RunwayCEO瓦倫祖拉（CristóbalValenzuela）在X平臺（此前的推特）上簡單發佈了兩個字，「GameOn．」（競爭開始了）。幾個月前，Runway剛剛發佈了Gen-2視頻模型。而另一家AI視頻公司Stability的CEO莫斯塔克（EmadMostaque）則直接感慨，「奧特曼真是個魔術師。」

Runway創辦已有五年時間，在AI視頻領域佔據着先發優勢，已經得到了好萊塢主流片場的使用。去年拿到七項奧斯卡大獎的年度影片《瞬息全宇宙》就使用了Runway來製作AI視頻。在《瞬息全宇宙》大獲成功之后，Runway新一輪融資估值也水漲船高，達到了15億美元，是一年之前估值的三倍。

文生視頻領域是目前最熱的創業領域。過去幾個月時間，隨着生成式AI熱潮湧動，也涌現出了不少文本生視頻和圖片生視頻的創業公司。A16z的AI投資合夥人摩爾（JustinMoore）列出了他所跟蹤的20多家文生視頻創業團隊，其中不乏Pika、Zeroscope這樣一度引發網絡驚歎的創業新貴。

去年年底，斯坦福華人畢業生創辦的Pika視頻一度引發了中美互聯網的驚歎。得益於AI視頻的驚艷表現，這家僅有四人的創業公司，在不到半年時間就完成了超過5500萬美元的三輪融資，估值飆升到了2.5億美元。

但現在，AI巨頭OpenAI直接拋出了Sora。無論是視頻時長，還是畫面精細度，還是細節完整性，或是多鏡頭拍攝，Sora都遠遠超越了這些小創業公司的視頻，用碾壓來形容也並不為過。雖然AI視頻領域還有着巨大的提升和增長空間，但這些小公司的未來是否有能力與OpenAI競爭依然是個巨大的疑問。

左右好萊塢勞資談判

不過，Sora影響的不僅是其他AGI視頻創業公司的生存空間，更會改變整個好萊塢以及電影、電視、廣告、遊戲行業的未來遊戲規則。

好萊塢使用AI製作圖片和視頻，並不是什麼新鮮事，從CG（電腦動畫）、VR到AI，影視娛樂行業一直是高新技術的最先採用者。然而，與其他技術不同，AI工具始終是紮在好萊塢從業人員心中的一根刺。

除了《瞬息全宇宙》使用了Runway的AI視頻工具，去年21世紀福克斯已經與IBM沃森合作，用AI工具為關於AI主題的恐怖片《摩根》製作預告片；迪士尼旗下的漫威更完全用AI製作了《祕密入侵》的開頭動畫。

當時正值好萊塢演員和編劇工會大罷工期間。而生成式AI在影視行業的應用也是雙方的爭議焦點之一。就在雙方談判的過程中，演員編劇們得知迪士尼漫威新一季的《祕密入侵》已經完全使用AI技術打造開場場景。這一消息讓雙方的談判再次擱淺。

為什麼影視行業使用AI工具引發這麼多的爭議？業內人士主要是擔心製片方使用現有素材進行AI訓練，未來頻繁使用AI工具生成內容，這不僅侵犯到了創作者已有作品的版權，沒有給他們足夠的回報，更會影響到創作者未來的工作機會和空間。

雖然去年編劇和演員們不惜讓行業停擺和自己失業，換來了製片方們的暫時讓步，對AI工具的使用制定更多的規範。但三年后的下一次勞資談判，面對性能必然大升級的AI，演員編劇們的處境可能會更加艱難。

　電影電視TikTok化

隨着文生視頻模型Sora的驚艷亮相，或許整個好萊塢從業人員都會面臨着一個巨大的疑問：按照AI的指數級進化速度，或許不需要再等待多久，AI就可以生成一部完整劇情的短片甚至電影，從劇本到拍攝到表演到后期都可以完全搞定，那麼好萊塢的未來會變成什麼樣子？

拍攝《當她醒來》恐怖電影的好萊塢導演戴夫·克拉克（DaveClark）已經在使用AI工具製作電影。在他看來，Sora等AI技術帶來的並不是威脅，創作者需要去擁抱AI技術，打造此前無法實現或是想象的內容。「這是改變遊戲規則的技術。你不應該去擔心自己的工作，而應該擔心是誰在使用這些工具。」

行業調查公司CVLEconomics上個月發佈的一項對300位好萊塢行業領袖的調查顯示，擔憂情緒瀰漫在整個好萊塢。36%的受訪者表示生成式AI已經減少了他們公司的日常工作技能需求，72%的受訪公司都是生成式AI工具的最早採用者。

更為殘酷的現實是，75%的受訪者承認，生成式AI（工具、軟件、模型）已經促使他們業務部門削減與合併工作崗位。這些掌控着好萊塢行業秩序的人們預計，未來三年好萊塢總計會有超過20萬人的工作崗位會遭受AI衝擊，尤其是視覺特效、音效師、畫圖師等后期工作崗位。

電影《ShovelBuddies》的編劇海勒曼（JasonHellerman）認為，隨着AI工具的逐漸完善，未來製片方當然可能會通過Sora這樣的工具生成視頻，而不再需要給一個製作團隊支付薪酬。AI生成的內容也可能會創造一個全新的類型，但如果任何人都可以用AI製作視頻和電影，成為「內容創作者」，這也不可避免會帶來專業水準的降低。

他預測，未來每個人都可以生成自己視頻，就像是現在每個人都在手機上拍攝和觀看TikTok短視頻。習慣了短視頻的Z世代年輕人未來會逐漸摒棄電影和電視這樣的長內容。也許在AI生成視頻的未來，電影和電視也會變成類似TikTok短視頻這樣的形式。

OpenAI的Sora會砸掉誰的飯碗？

推薦文章

提價83%需求卻暴增400%！智譜、MiniMax鎖定大模型定價權，AI Agent元年即將開啟？

港股見底了嗎？北水大舉加倉逾600億港元！大行看好4月做多窗口來臨，十大金股一圖睇全

華盛早報 | 伊朗與阿曼擬共管霍爾木茲！美股V型反轉；伊朗襲擊甲骨文、亞馬遜數據中心；港美股今日因假期休市一天

諾和諾德稱：口服版Wegovy減肥效果優於禮來GLP‑1口服藥

美股機會日報 | 特朗普粉碎停戰幻想！恐慌指數飆升12%，納指期貨跌約2%；美油期貨暴漲超9%！油氣股飆升，美國原油基金ETF漲超9%

清明休市提醒 | 港股本周五休市，下周三恢復交易；美股周五休市一天

油價上漲 此前特朗普表示伊朗衝突可能在未來幾周升級

野村：特朗普講話未能發出局勢降温的明確信號

油價上漲此前特朗普表示伊朗衝突可能在未來幾周升級