熱門資訊> 正文
2024-10-30 09:43
文 | 袁瀅靚
編輯 | 鄧詠儀
《智能涌現》獲悉,智能數字人平臺開發商「向量方程」,此前完成近千萬元天使輪融資,由真成資本(已投資得到APP、印象筆記)領投,北京極信管理諮詢和上海天使匯跟投。資金將用於豐富數字人產品技術的研發。
「向量方程」成立於2024年3月14日,創始人&CEO沈仁奎為原得到/ 羅輯思維CTO,曾先后就職於騰訊和百度,聯創團隊具有百度、美團等互聯網研發經驗。產品「石榴數字人」為聚焦於亞洲人的一站式AI數字人視頻創作平臺,於今年6月開始商業化運作。
短視頻早已成為流量獲客的王者,AI數字人更添一把火。海外AI視頻生成公司Heygen,年化收入在14個月內從100萬美元快速增長到3500萬美元。國內預計到2025年,虛擬數字人的核心市場規模將達到480.6億元人民幣,騰訊、阿里、字節等也紛紛入局。
沈仁奎向《智能涌現》透露,早在四年前他就萌生了做數字人的想法,只是一直在等到技術拐點的到來。
「當看到一篇論文中提出的數字人新架構時,我意識到這就是自己一直在等待的、可商業化的技術。」他提到,「以往採集建模數據通常一天起步,現在3-5分鍾就能迅速生成一個數字人。」
數字人賽道正從上一代的3D引擎等技術棧向大模型靠攏,數字人的生產效率有很大提升——即便是低價位數十元做出來的數字人效果,也比以前一百多萬的效果要強。
在沈仁奎看來,因為技術負債少,公司「新」反而是優勢。而在巨頭的競爭中,新一代創業者的機會依舊存在。巨頭的主要賽道是信息分發,而不是信息生產,並且他們即使入局也難以通吃標準化產品和服務。
「石榴數字人」是典型的信息生產產品,能夠將文本信息轉為數字人視頻,為內容創作提效。畫面上,它的仿真程度高,能1:1重現真人視頻的人物、場景、服裝和動作。高質數據訓練得到的優質底層模型,可以促進不同語種的嘴型對齊等任務,並大幅減少所需的數據量。
與目前頭部的視頻生成廠商相比,「石榴數字人」錄製視頻所需時長較短,從以往的30分鍾大幅縮短至了30秒。同時,「石榴數字人」更適應中文環境,在户外走動等動態場景中表現出優勢,還可以實現多個數字人在同一畫面中互動。
能打籃球、能騎車、會説多國語言的石榴數字人
聲音上,TTS(Text To Speech,文本轉語音)的機械音問題得到了解決,現在的發聲更真實自然、抑揚頓挫。售價千元級的自研高階版聲音對標業內十萬級別,可以個性化定製口音與發聲習慣,更高質,也更適配場景。
沈仁奎向《智能涌現》介紹,「石榴數字人」已實現全流程自動化定製數字人。一方面,用户在錄製視頻時無需注意對口型的細節,臉部扭動角度不超過30度即可。另一方面,系統能夠處理中英文混排和複雜的數字場景,通過智能斷句和上下文分析,實現自然流暢的輸出。因為去除了人工干預成本,平臺只按視頻生成時長收費。
對於高客單,「石榴數字人」還會提供AI助手,在微信對話窗口中實現抓字幕、改寫和生成視頻等交互功能。
當前,國內許多產品聚焦於創作者生態,「石榴數字人」也推出了一鍵式視頻創作服務,這是現階段應用最廣泛的場景。然而,沈仁奎認為,面向企業級市場的機會更大,且市場尚未飽和,是公司更關注的方向。
在這條賽道上,「石榴數字人」為企業提供創新的視頻解決方案,藉助數字人和自動化技術,幫助企業快速生成大量視頻內容,提升運營效率並加速效果優化。
此外,「石榴數字人」計劃拓展至互動視頻領域,讓數字人能夠與觀眾進行實時互動,不再侷限於靜態展示。
互動視頻並不等同於直播,直播只是其中的一個應用場景之一。儘管數字人直播是未來的發展方向,沈仁奎表示當前仍在等待技術進一步成熟。
「數字人直播的核心挑戰不僅在於技術,更在於對行業需求的深刻理解,關鍵在於快速提煉出可操作的行業經驗,並將其轉化為用户友好的產品體驗。」他補充道。
目前,「石榴數字人」已成功實現商業化運營。未來,公司將持續優化產品功能,擴大市場佈局,並吸引更多優秀人才,推動進一步發展。