熱門資訊> 正文
2026-05-12 15:45
Anijam是一款面向動畫創作場景的AI Video Agent,目的是以更低成本提升動畫內容生產效率。用户只需輸入自然語言提示,即可自動完成角色生成、分鏡設計等關鍵環節的自動生成。
創始人兼CTO王珏,先后獲得清華大學學士、碩士學位及美國華盛頓大學博士學位。曾於2020至2023年擔任騰訊傑出科學家、AI Lab視覺計算中心總監,擁有IEEE Fellow頭銜,2017至2019年任曠視美國研究院院長,2007至2017年任Adobe首席科學家。
CEO 方晨,博士畢業於美國常春藤院校達特茅斯學院,曾先后任職於 Adobe Research 、字節跳動北美 AI Lab 及騰訊,具備從技術研發到產品落地的完整經驗,其成果已廣泛應用於Photoshop、Lightroom、抖音、微信等產品。
已累計完成千萬美金級別的融資,投資方包括奇績創壇、Atypical Ventures 和元璟資本。
Anijam的核心定位,是打造一款面向視頻創作者的AI Video Agent,類似於視頻領域的「Cursor」。就像 Cursor 這類AI編程工具能夠理解需求、協助完成開發任務一樣,Anijam也希望推動視頻創作走向「AI 驅動生成」,幫助創作者完成角色生成、分鏡設計等關鍵環節。
視頻創作本質上是一項高門檻、長流程的專業工作。一個完整的視頻,從前期的腳本構思、角色設定、分鏡拆解,到中期的鏡頭設計、動作銜接、畫面風格統一,再到后期的剪輯、配音和節奏調整,背后需要系統的創作方法和專業能力。
AI雖然讓視頻生成變得更容易,但對大多數普通人來説,真正的難點並不在於生成,而在於如何搭建敍事、設計鏡頭語言,並組裝成一支表達清晰的好視頻。
方晨認為,AI大模型會由頭部公司主導,而機會點在於解決生成內容不可控、難修改的問題。
基於這一判斷,產品將視頻創作流程進行了重新拆解。Anijam通過AI,將原本割裂、複雜的創作流程進行整合,讓用户通過更簡單的交互完成完整的視頻生產。
Anijam在后台整合了多個第三方大模型,並在Agent流程編排、后編輯算法及用户體驗優化上進行了優化。
用户只需輸入一句自然語言,例如「製作一段孫悟空三打白骨精的視頻」,系統就會自動完成從故事大綱生成、視覺概念設計,到分鏡腳本拆解、關鍵幀生成、視頻片段製作及最終合成的完整流程。
整個過程以畫布為載體形式,用户可以在任意環節介入修改。例如調整畫風、增刪角色設定,或對鏡頭細節進行優化。
在這一過程中,系統會自動識別故事中的關鍵元素,包括角色、場景、道具及風格,並基於此生成完整的分鏡鏡頭。每一個鏡頭都會包含場景描述、角色狀態、鏡頭語言等信息。
創作者不僅可以看到每個分鏡的大致效果,還可以通過自然語言進行修改,例如調整鏡頭視角、改變構圖,或者替換局部元素等。同時,系統會自動生成每個分鏡的關鍵幀,並支持逐鏡頭預覽與修改。
這也是Anijam的關鍵能力之一,即從抽卡式生成視頻走向「可控編輯」。
傳統AI視頻生成往往依賴反覆生成整段內容,一旦某一幀不滿意,需要整體重來。而Anijam強調「局部可編輯」,例如只修改角色表情,而不影響動作或背景。
Anijam正在優化AI驅動的視頻編輯能力——不僅支持局部修改,還在嘗試構建AI的自反饋機制。在方晨的規劃中,Anijam未來會爭取讓AI自動評價視頻生成效果,扮演一個「第三方AI導演」,對AI工具生成的鏡頭質量打分,並反向優化生成過程,通過「AI指導AI」來減少人工調試的次數。
在產品形態上,Anijam同時提供桌面端與移動端。Web端承載更復雜的創作與編輯能力,適合長流程生產。移動端則以對話式交互為主,界面更輕量,適配高頻內容創作者。團隊還在構建創作者社區,將優質內容沉澱為模板,供用户複用。
當前產品已支持最長5至10分鍾的視頻生成,具體耗時取決於內容複雜度。一條約2分鍾的視頻,生成過程可能需要數十分鍾至一小時。
在商業模式上,產品採用分層訂閲模式,覆蓋不同強度的創作需求,從25到60美元不等,價格區間的提升,本質上對應的是算力額度與生成能力的差異。
隨着用户與Agent的持續交互,系統會積累大量與創作相關的數據,包括用户偏好、風格選擇、修改路徑等。這些數據將被進一步結構化,轉化為「創作記憶」,並嵌入到Agent中,使其逐步具備個性化能力。
Anijam試圖實現的,是用一句話啟動創作,用AI完成生產,並對每一幀內容進行可控修改,同時在持續使用中不斷變得更高效。
視頻大模型的持續進步是確定的趨勢,這對所有入局的玩家來説都是紅利。真正的差異不在模型本身,而在模型之外的能力構建,例如后編輯能力、Agent流程編排,以及如何讓生成內容變得可用、可修改。相比單純調用模型,如何讓生成內容變得可用、可修改,纔是產品競爭的核心。
這一賽道還處在早期階段,產品還不完美,仍需要用户大量參與修改。在這個階段,最該擔心的不是競爭,而是效率。要儘快進入市場、獲取用户,並在真實使用中積累數據與認知。
創業公司與大廠競爭的關鍵,是要更早跑起來,形成用户留存與數據沉澱。
參考圖像生成市場的發展路徑,AI視頻領域未來也不會出現一家壟斷的格局,而是由多家廠商分佔不同份額。市場結構可能更加均衡,每家佔據一部分用户與場景,而不是單一平臺佔據絕大多數份額。
當前AI視頻的瓶頸,並不只是畫面生成能力,而是敍事能力。
讓模型在兩分鍾內清晰講述一個完整故事,本身就是一件難度極高的事情。這意味着,真正的挑戰不在於生成單個片段,而在於如何用導演語言組織內容,講述用户的故事。
未來的創作者工具不再只是提供功能,而是成為用户的創作夥伴。隨着創作者與Agent持續交互,系統會積累用户在創作過程中的行為數據,包括偏好、修改邏輯與經驗。Agent可以逐漸理解用户意圖,甚至提前完成部分創作決策,最終演化為一個具備記憶與進化能力的「數字分身」。
Anijam的目標並不只是做一個工具,而是成為類似Adobe的創作平臺。通過技術重塑創作流程,在提升效率、降低門檻的同時,承載更大規模的內容生產與創作者生態,從而讓更多人蔘與創作,並從中獲得價值。
隨着Agent能力的進一步提升,視頻創作將逐漸從「人不斷參與反饋」的過程,轉變為更自動化的生產模式。未來甚至可能出現「Agent替人反饋」的情況。用户只需提出需求,其余由系統自行完成迭代與優化。
AI正在降低創作門檻,讓更多人能夠參與內容生產。類似短視頻平臺的出現,使原本無法進入院線的創作者獲得了表達空間,這是一次創作平權的推進。
但與此同時,注意力分配並不會完全平均。院線與短視頻並非替代關係,而是新增渠道,頭部內容依然會集中流量與商業價值。因此,AI帶來的不是「平均化」,而是在擴大供給的同時,繼續強化頭部效應。
目前的視頻生成成本仍然很高昂,但隨着后續的需求增加和技術進步,價格會逐步下滑。
一方面,大規模的需求會持續壓低成本;另一方面,模型層面的優化與加速將顯著減少算力消耗,例如通過架構優化、硬件協同等方式,將原本需要大量token的生成過程大幅壓縮。這意味着,同樣一段視頻所需的計算資源可以實現數量級下降,從而帶動整體價格快速走低,進一步推動AI視頻應用的普及。
在商業模式上,當前以算力為核心的計費方式,本質上是階段性形態。隨着技術成熟與成本下降,未來更可能轉向「按結果付費」——即用户在對AI視頻滿意並願意下載時,才為最終產出買單,而非為生成過程中的token消耗付費。
這一模式的成立,依賴於產品在質量、成本與速度之間達到平衡,一旦生成結果足夠穩定且可控,用户的付費邏輯也會隨之發生轉變。
Anijam選擇從動畫類型(animation)切入。原因在於,這一群體本身已經習慣數字化創作流程,對AI工具的接受度更高,相比實拍視頻創作者,遷移成本更低。同時,這類用户往往具備較強的創作意願,是早期最容易被激活的一批人。
在更廣泛的用户層面,團隊觀察到,海外市場存在大量「輕創作用户」——包括副業創作者、內容愛好者等,他們具備較強的內容生產意願,並且已經在YouTube、Instagram等平臺實現初步商業化。
方晨認為,在B端專業內容公司之外,to C創作者同樣具備付費能力與增長潛力。
另外,動畫與真人視頻在技術難度上存在明顯差異。儘管兩者在生成時長上相近,但真人視頻對質量的要求更高,例如需要跨越「恐怖谷效應」,同時在細節、銜接與轉場上更接近真實,這使得整體實現難度顯著提升。相比之下,動畫在風格容錯與表達上更容易達到可用水平。
從長期來看,真人視頻仍然是更大的市場方向。隨着技術成熟與行業方案逐步完善,真人視頻的需求一定會釋放,我們未來也會進入這一領域。