熱門資訊> 正文
2025-01-15 15:29
做過 Up 主、YouTuber 或是視頻自媒體從業者都知道,一部傳到平臺上 10 分鍾的成片,背后可能是幾個小時的素材。如同快充般的「拍攝 1 小時,剪出 1 分鍾」。而在電影行業,常見素材比也在 10:1 到 20:1 甚至更高。
那些被棄用的素材叫做「廢片」,在成片輸出后,這些素材就如同廢品一樣,留着只會佔據硬盤空間。
但就像現實生活有願意花錢收廢品,現在大 AI 公司想開始花錢「收廢片」了。
1 月 11 日,據外媒報道,Open AI、Google、Moonvalley 等公司正在購買視頻創作者們拍攝但未使用的「廢片」。高質量 4K、無人機、3D 動畫素材,1 - 4 美元(約合 7.3 - 30 元)一分鍾,爲了 YouTube、TikTok、Instagram 等網絡視頻製作的素材 1 - 2 美元(約 7.3 - 15 元)一分鍾。
這麼看,只要廢片質量足夠好,一個小時的廢片最高能賣 1800 元,可能比平臺給 Up 主的分成還高。
1. AI 巨頭,是真的「餓了」
為什麼這些科技公司,要花錢買用户拍了不用的廢片?
原因很簡單:視頻數據不夠用了。
生成式視頻模型、自動駕駛系統甚至機器人訓練,都需要大量的視頻作為訓練數據。而優質視頻不僅創作門檻高,在 AI 時代的版權劃分也很模糊。
廣告、電影公司的版權價格昂貴,網絡平臺通常也只有發行權而非使用權,和導演及製作團隊簽署的版權合同里,也鮮少涉及到 AI 使用權的條款。
視頻網站同理,如果視頻模型想合法抓取 YouTube 的視頻,那應該聯繫 YouTube 還是 YouTuber?這同樣是 AI 時代還沒解決的版權灰色問題。
2024 年 4 月美國眾議員提出的《生成式 AI 版權披露法案》,要求數據集製作者向註冊員提交「任何受版權保護的作品的充分詳細摘要」,否則將面臨罰款。
在此背景下,Open AI、Google 還有其他 AI 公司就想到了「不買成片買廢片」的方式。
不過 AI 大公司並不直接和創作者對接,而是通過第三方專業公司去聯繫平臺和創作者,他們只付錢。怎麼談、找誰買、買回來怎麼用,這些都由中介公司和平臺協商。
幾家中介公司表示,目前已經買了 500 多萬美元的素材,對接的 AI 公司多達 17 家,包括 OpenAI、Meta、微軟等。
AI 公司買回來后也不能亂用,由第三方專業公司做「中介擔保」限制了廢片的使用範圍:AI 公司不能創建創作者的數字分身;不能在 AI 模型里重現專屬創作者的 AI 場景,比如直接生成某個 Up 主固定的背景或是用 ta 的經典梗、口頭禪等;不能用有損創作者聲譽的方式使用素材。
YouTube 在上個月也加入了類似的新功能:YouTuber 自行決定 AI 是否能抓取自己的視頻內容,甚至可以選擇授權的 AI 公司(當然也可以全選)。不過目前 YouTube 還沒有給出授權費用的政策。
2. 視頻模型的軍備競賽
互聯網內容的發展,隨着帶寬和信息量的增長,軌跡從文字逐漸轉向視頻,大模型也是如此。
視頻模型成為過去一年大模型最卷的賽道,很多 AI 公司更進一步,直接開始卷可以生成動態場景的「世界模型」,但無論哪種模型,數據養料都離不開視頻。於是各大 AI 公司紛紛開始了軍備競賽,誰能拿到更多的視頻數據,誰的視頻模型可能就會更好。
在前不久的 CES 2025 上,英偉達發佈了世界基礎模型平臺 Cosmos。據介紹,Cosmos 經過了 2000 萬小時的視頻訓練量。然而英偉達在去年就曾被 404 Media 爆出,在未經授權的前提下,違規抓取了大量 YouTube 和 Netflix 的視頻以訓練「內部名稱為 Cosmos 的產品」。
據爆出的英偉達內部聊天記錄,英偉達的 AI 科學家和高管匯總了大量 YouTube 精選視頻數據集用於模型訓練,包括一個名為 HD- VG-130M 的數據集,該數據集由北大的研究人員構建,包含 1.3 億個 YouTube 數據,使用權限僅限於學術研究。
在被質疑「YouTube 服務條款禁止下載,數據也只能用於研究目的」后,英偉達高管表示「受版權保護的數據能否用於訓練,目前是一個懸而未決的法律問題……在大語言模型上,我相信我們的法律團隊已經批准了這種做法,因此也可能會批准視頻訓練。」
在英偉達之前,OpenAI 的視頻大模型 Sora 已經被 YouTube 點名批評了。正在和 OpenAI 打官司的《紐約時報》率先報道稱,OpenAI 採集了超一百萬小時的 YouTube 視頻用來訓練 GPT-4。
而對 Sora 訓練數據來源,當時的 OpenAI 首席技術官(已離職)Mira Murati 直言「實際上,我也不確定」YouTube CEO Neal Mohan 迴應稱「如果 OpenAI 使用 YouTube 視頻來訓練 Sora,就明確違反了 YouTube 的使用條款。」
同樣的態度,YouTube 又把這段採訪發給了 404 Media,迴應了一次英偉達。
也有視頻模型另闢蹊徑,將在未來兩個月內公佈的新視頻模型「Marey」要做行業里「最乾淨」的,他們號稱全部訓練數據都拿到了授權,而且 Marey 的目標用户就是好萊塢和整個電影行業的大型工作室。
這是因為電影不僅是視頻質量素材的*,也是對版權規範最嚴格的視頻領域。
對網絡視頻創作者而言,廢片本身的歸宿就是備份硬盤甚至回收站,如今有大公司願意出錢讓「廢片再利用」,如果這種模式能持續運轉,也不失為對小創作者的一種營收手段。
對更大牌的「創作者」,比如電影公司、製片廠而言,技術早已滲透甚至改造了電影行業,從 CGI 生成、虛擬製作到 AI 合成語音、面部去老化等等,AI 無非是一種提高影視製作效率的新技術手段。
但無論大小創作者,或許對 AI 視頻生成都有着「殺雞取卵」的警惕感。試想,當一個創作者源源不斷地把自己的廢片賣給 AI 模型,當 AI 模型已經足夠以假亂真的時候,我們是否還真的需要一個具體的創作者出鏡?當 AI 可以生成電影級空鏡頭,*視覺衝擊的*后,電影行業還是否需要技術高超的攝影師、數字*製作者……
「學習你,追趕你,替代你」這是每一個創作者面對生成式 AI 的進化時,都難以避免的恐懼。只能自我安慰道:在擋不住的 AI 浪潮下,廢片還能賣錢,這總比免費當個「數據提款機」要強吧。
【本文由投資界合作伙伴微信公眾號:極客公園授權發佈,本平臺僅提供信息存儲服務。】如有任何疑問,請聯繫(editor@zero2ipo.com.cn)投資界處理。