Sora開放使用文生視頻繼續激戰

2024-12-12 10:35

轉自：北京商報

在公開預覽過去10個月后，在OpenAI的12天連更計劃的第3天，視頻生成大模型Sora終於正式登場。

12月10日，OpenAI宣佈正式向用户開放Sora，該系統可以根據文本提示生成逼真的視頻。應用落地也來得很快。作為「視頻版GPT」，OpenAI已開始向電影製片廠、媒體高管以及經紀公司示好，還允許一些藝術家、知名演員和導演試用該服務。

巨強巨貴

今年2月，OpenAI首次向外界展示了Sora的存在。據其介紹，Sora可以直接輸出長達60秒的視頻，並且包含高度細緻的背景、複雜的多角度鏡頭，以及富有情感的多個角色。OpenAI在官網上公佈了數十個視頻demo，並不斷在社交平臺X上放出由Sora生成的視頻。這些內容被集合推送至OpenAI的TikTok賬號上，短短5天內便獲得了51.3萬次贊，粉絲數也漲至10.6萬。

Sora不僅為OpenAI帶來了大量粉絲，也讓其估值進一步提升。不過，當時這家公司表示，Sora在短期內不會向大眾開放，因為其「技術仍存在一些缺陷，包括一些空間問題」。

在將近10個月之后，萬衆矚目下，Sora終於在此次系列發佈中重磅登場。OpenAI表示，2月發佈Sora之后，團隊開發了其新版本Sora Turbo，其性能有了顯著進步，即日起該版本將作為獨立產品提供給ChatGPT Plus和Pro用户。

定價方面，Sora Turbo將免費提供給ChatGPT Plus和Pro用户，月租20美元（約合人民幣145元）的Plus用户，每月最多可以生成50個480P分辨率的優先視頻；Pro訂閲者則最多可生成500個優先視頻，普通視頻無限量生成，可下載無水印版視頻，對應每月費用為200美元（約合1450元）。

這一定價也引發了不同的聲音，有用户直呼「太貴」，有用户卻認為「一分錢一分貨」。雖然當前價格仍被部分用户認為偏高，但這已是OpenAI努力降低成本的結果。OpenAI還透露，他們計劃針對不同用户類型開發新的定價模式，並將於明年初推出。

視頻版GPT

目前，美國及其他市場的ChatGPT付費用户可以通過該網站開始使用Sora，但在歐洲大部分地區和英國還需要一段時間才能使用，中國用户依然受限。

不過，由於實在是太火爆，Sora網站一度被擠到崩潰，OpenAI CEO山姆·奧特曼（Sam Altman）表示：「由於需求超出預期，我們將不得不間歇性地關閉新用户註冊，並且生成內容的速度會在一段時間內減慢。」

在技術路線上，目前，業界普遍猜測Sora的成功延續了OpenAI的Scaling law法則，即通過海量的數據、大量的算力，再加上大參數模型，最終「大力出奇跡」。OpenAI研究科學家Noam Brown在Sora Turbo發佈后表示，Sora是scale（規模）力量最直觀的展示。山姆·奧特曼則表示，「大家可以將Sora看作視頻版的GPT-1」。OpenAI還表示，Sora是一項理解和模擬現實的基礎性AI技術，是開發能夠與物理世界互動模型的重要一步。

中國銀河證券研究院的報告也顯示，Sora對算力需求呈指數級增長。其根據Sora參數規模推演出的訓練單次算力需求或可達到2.6×10^24Flops，相當於GPT-3175B的8.2倍。目前Sora還在初級階段，伴隨不斷迭代調優，其訓練數據集規模將進一步增大，未來算力需求也會大幅增加。

在國內，互聯網大廠和大模型公司也在紛紛跟進視頻大模型這一賽道，包括字節跳動、快手，今年發佈視頻生成模型的公司還包括阿里雲、Minimax、生數科技、智譜AI等公司。就在最近，騰訊混元大模型也宣佈上線視頻生成能力，正式加入競爭激烈的視頻生成賽道。

不過，視頻生成模型領域雖然看起來火熱，也面臨着非常嚴峻的挑戰。近日，百度CEO李彥宏稱「百度不做Sora」的演講被媒體曝光，李彥宏在內部講話中稱，Sora這種視頻生成模型的投入周期太長，10年、20年都可能拿不到業務收益，無論多火爆，百度都不去做。

商業化空間打開

自今年2月首次預告Sora以來，OpenAI便開始與電影製片廠、媒體高管以及經紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。市場預計，Sora的發佈會對視頻製作領域帶來革命性的變化，無論是電影製作、廣告、遊戲開發還是社交媒體，都可以藉助視頻生成大模型降低視頻創作的門檻，產生新的機遇。

對於企業和內容創作者而言，視頻製作往往是一項繁瑣且耗時的任務。藉助視頻生成大模型，用户只需提供簡短的文本描述，即可自動生成高質量視頻。「這不僅節省了大量時間，也大幅降低了對專業技能的要求，即使沒有視頻製作經驗的用户也能輕松創建專業級內容。視頻生成大模型的廣泛應用有望改變廣告營銷、產品推廣和教育輔導等多個行業的內容創作流程，推動生產力的升級。」一位視頻后期製作人員對北京商報記者表示。

「國產多模態視頻大模型歷經一年多迭代，已逐步提升對內容製作的賦能效果，拓寬了創作邊界，預計后續AI影視領域商業化空間將打開。」開源證券表示。不過，業內人士也向北京商報記者表示，視頻生成大模型擁有樂觀的商業化前景的同時，從可用度而言，還未到大規模商用的階段，仍有很多技術難點需要克服，比如對物理世界規律的理解、高分辨率、鏡頭動作連貫性以及時長等，都是行業激戰且有待提升的重要維度。

此外，從AI誕生之初，對於版權的問題就爭論不休。有從事設計行業的人士對北京商報記者直言：「Sora確實厲害，但AI生成視頻內容質量和版權問題怎麼解決？會員免費用，那創作者收益呢？這些問題不解決，技術再牛也難長久。」

（記者趙天舒）

Sora開放使用 文生視頻繼續激戰

推薦文章

美股機會日報 | 凌晨3點！美聯儲將公佈1月貨幣政策會議紀要，納指期貨漲近0.5%；13F大曝光！巴菲特連續三季減持蘋果

美股機會日報 | 阿里發佈千問3.5！性能媲美Gemini 3；馬斯克稱Cybercab將於4月開始生產

港股周報 | 中國大模型「春節檔」打響！智譜周漲超138%；鉅虧超230億！美團周內重挫超10%

一周財經日曆 | 港美股迎「春節+總統日」雙假期！萬億零售巨頭沃爾瑪將發財報

從軟件到房地產，美國多板塊陷入AI恐慌拋售潮

Meta計劃為智能眼鏡添加人臉識別技術

危機四伏，市場卻似乎毫不在意

財報前瞻 | 英偉達Q4財報放榜在即！高盛、瑞銀預計將大超預期，兩大關鍵催化將帶來意外驚喜？

Sora開放使用文生視頻繼續激戰