繁體
  • 简体中文
  • 繁體中文

熱門資訊> 正文

視頻大模型Vidu正式開放API 生數科技商業化探索加速

2024-09-25 15:02

9月25日,生數科技聯合創始人兼CEO唐家渝在百度雲智大會上宣佈,生數科技旗下視頻大模型Vidu正式開放API(應用程序編程接口),並同步接入百度智能雲千帆大模型平臺,成為平臺接入的首個視頻大模型。

生數科技作為國內最早佈局多模態通用大模型的團隊之一,今年4月聯合清華大學發佈了視頻大模型Vidu。

6月,生數科技完成數億元Pre-A輪融資,由百度、北京市人工智能產業投資基金領投,中關村科學城公司、啟明創投等跟投。彼時,生數科技方面曾表示,將基於百度百舸·AI異構算力平臺持續訓練、提升模型能力,並逐步通過百度智能雲千帆平臺開放模型服務。

據唐家渝介紹,Vidu採用的架構是團隊純自研的U-ViT架構,是全球最早提出的Diffusion Transformer融合架構,早於Sora的DiT架構,這為通用生成任務奠定了重要基礎。

生數科技聯合創始人兼CEO唐家渝 圖片來源:企業供圖

生數科技聯合創始人兼CEO唐家渝 圖片來源:企業供圖

他同時表示,Vidu模型具備文生視頻和圖生視頻能力,同時支持中英文指令輸入;在時長方面,Vidu在模型層面最長可支持一鍵32s視頻的生成;畫面質感方面,Vidu最高可輸出1080p分辨率。

生數科技方面表示,目前,影視、動畫、廣告等行業的企業機構普遍存在規模化視頻產出需求,Vidu API的開放,將助力這些企業在視頻生產環節降本增效,並激發創意。同時對於眾多開發者而言,Vidu API的開放也為探索AI 2.0應用提供了重要基礎。

生數科技認為,視頻大模型高度個性化、自動化的內容創作能力,將賦予企業在營銷、品牌推廣和內容創新等場景中的全新競爭力,視頻模型的引入將成為創意產業提升競爭力的關鍵因素。基於此背景,開放Vidu API成為生數科技進一步推進商業化佈局的重要戰略舉措。

2024年以來,視頻大模型的競爭日趨激烈,9月24日,字節跳動剛剛宣佈發佈了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前,行業內已有快手的視頻生成大模型「可靈」;同時,阿里旗下的通義萬相在9月宣佈全面升級,併發布全新視頻生成模型;圖像賽道的老玩家美圖秀秀同樣在9月宣佈旗下的美圖奇想大模型(MiracleVision)視頻生成能力全面升級。

風險及免責提示:以上內容僅代表作者的個人立場和觀點,不代表華盛的任何立場,華盛亦無法證實上述內容的真實性、準確性和原創性。投資者在做出任何投資決定前,應結合自身情況,考慮投資產品的風險。必要時,請諮詢專業投資顧問的意見。華盛不提供任何投資建議,對此亦不做任何承諾和保證。