繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

Sora開放使用 文生視頻繼續激戰

2024-12-12 10:35

轉自:北京商報

在公開預覽過去10個月后,在OpenAI的12天連更計劃的第3天,視頻生成大模型Sora終於正式登場。

12月10日,OpenAI宣佈正式向用户開放Sora,該系統可以根據文本提示生成逼真的視頻。應用落地也來得很快。作為「視頻版GPT」,OpenAI已開始向電影製片廠、媒體高管以及經紀公司示好,還允許一些藝術家、知名演員和導演試用該服務。

巨強巨貴

今年2月,OpenAI首次向外界展示了Sora的存在。據其介紹,Sora可以直接輸出長達60秒的視頻,並且包含高度細緻的背景、複雜的多角度鏡頭,以及富有情感的多個角色。OpenAI在官網上公佈了數十個視頻demo,並不斷在社交平臺X上放出由Sora生成的視頻。這些內容被集合推送至OpenAI的TikTok賬號上,短短5天內便獲得了51.3萬次贊,粉絲數也漲至10.6萬。

Sora不僅為OpenAI帶來了大量粉絲,也讓其估值進一步提升。不過,當時這家公司表示,Sora在短期內不會向大眾開放,因為其「技術仍存在一些缺陷,包括一些空間問題」。

在將近10個月之后,萬衆矚目下,Sora終於在此次系列發佈中重磅登場。OpenAI表示,2月發佈Sora之后,團隊開發了其新版本Sora Turbo,其性能有了顯著進步,即日起該版本將作為獨立產品提供給ChatGPT Plus和Pro用户。

定價方面,Sora Turbo將免費提供給ChatGPT Plus和Pro用户,月租20美元(約合人民幣145元)的Plus用户,每月最多可以生成50個480P分辨率的優先視頻;Pro訂閲者則最多可生成500個優先視頻,普通視頻無限量生成,可下載無水印版視頻,對應每月費用為200美元(約合1450元)。

這一定價也引發了不同的聲音,有用户直呼「太貴」,有用户卻認為「一分錢一分貨」。雖然當前價格仍被部分用户認為偏高,但這已是OpenAI努力降低成本的結果。OpenAI還透露,他們計劃針對不同用户類型開發新的定價模式,並將於明年初推出。

視頻版GPT

目前,美國及其他市場的ChatGPT付費用户可以通過該網站開始使用Sora,但在歐洲大部分地區和英國還需要一段時間才能使用,中國用户依然受限。

不過,由於實在是太火爆,Sora網站一度被擠到崩潰,OpenAI CEO山姆·奧特曼(Sam Altman)表示:「由於需求超出預期,我們將不得不間歇性地關閉新用户註冊,並且生成內容的速度會在一段時間內減慢。」

在技術路線上,目前,業界普遍猜測Sora的成功延續了OpenAI的Scaling law法則,即通過海量的數據、大量的算力,再加上大參數模型,最終「大力出奇跡」。OpenAI研究科學家Noam Brown在Sora Turbo發佈后表示,Sora是scale(規模)力量最直觀的展示。山姆·奧特曼則表示,「大家可以將Sora看作視頻版的GPT-1」。OpenAI還表示,Sora是一項理解和模擬現實的基礎性AI技術,是開發能夠與物理世界互動模型的重要一步。

中國銀河證券研究院的報告也顯示,Sora對算力需求呈指數級增長。其根據Sora參數規模推演出的訓練單次算力需求或可達到2.6×10^24Flops,相當於GPT-3175B的8.2倍。目前Sora還在初級階段,伴隨不斷迭代調優,其訓練數據集規模將進一步增大,未來算力需求也會大幅增加。

在國內,互聯網大廠和大模型公司也在紛紛跟進視頻大模型這一賽道,包括字節跳動、快手,今年發佈視頻生成模型的公司還包括阿里雲、Minimax、生數科技、智譜AI等公司。就在最近,騰訊混元大模型也宣佈上線視頻生成能力,正式加入競爭激烈的視頻生成賽道。

不過,視頻生成模型領域雖然看起來火熱,也面臨着非常嚴峻的挑戰。近日,百度CEO李彥宏稱「百度不做Sora」的演講被媒體曝光,李彥宏在內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益,無論多火爆,百度都不去做。

商業化空間打開

自今年2月首次預告Sora以來,OpenAI便開始與電影製片廠、媒體高管以及經紀公司展開會談。OpenAI還允許一些藝術家、知名演員和導演試用該服務。市場預計,Sora的發佈會對視頻製作領域帶來革命性的變化,無論是電影製作、廣告、遊戲開發還是社交媒體,都可以藉助視頻生成大模型降低視頻創作的門檻,產生新的機遇。

對於企業和內容創作者而言,視頻製作往往是一項繁瑣且耗時的任務。藉助視頻生成大模型,用户只需提供簡短的文本描述,即可自動生成高質量視頻。「這不僅節省了大量時間,也大幅降低了對專業技能的要求,即使沒有視頻製作經驗的用户也能輕松創建專業級內容。視頻生成大模型的廣泛應用有望改變廣告營銷、產品推廣和教育輔導等多個行業的內容創作流程,推動生產力的升級。」一位視頻后期製作人員對北京商報記者表示。

「國產多模態視頻大模型歷經一年多迭代,已逐步提升對內容製作的賦能效果,拓寬了創作邊界,預計后續AI影視領域商業化空間將打開。」開源證券表示。不過,業內人士也向北京商報記者表示,視頻生成大模型擁有樂觀的商業化前景的同時,從可用度而言,還未到大規模商用的階段,仍有很多技術難點需要克服,比如對物理世界規律的理解、高分辨率、鏡頭動作連貫性以及時長等,都是行業激戰且有待提升的重要維度。

此外,從AI誕生之初,對於版權的問題就爭論不休。有從事設計行業的人士對北京商報記者直言:「Sora確實厲害,但AI生成視頻內容質量和版權問題怎麼解決?會員免費用,那創作者收益呢?這些問題不解決,技術再牛也難長久。」

(記者 趙天舒)

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。