熱門資訊> 正文
2024-09-25 15:02
9月25日,生數科技聯合創始人兼CEO唐家渝在百度雲智大會上宣佈,生數科技旗下視頻大模型Vidu正式開放API(應用程序編程接口),並同步接入百度智能雲千帆大模型平臺,成為平臺接入的首個視頻大模型。
生數科技作為國內最早佈局多模態通用大模型的團隊之一,今年4月聯合清華大學發佈了視頻大模型Vidu。
6月,生數科技完成數億元Pre-A輪融資,由百度、北京市人工智能產業投資基金領投,中關村科學城公司、啟明創投等跟投。彼時,生數科技方面曾表示,將基於百度百舸·AI異構算力平臺持續訓練、提升模型能力,並逐步通過百度智能雲千帆平臺開放模型服務。
據唐家渝介紹,Vidu採用的架構是團隊純自研的U-ViT架構,是全球最早提出的Diffusion Transformer融合架構,早於Sora的DiT架構,這為通用生成任務奠定了重要基礎。
他同時表示,Vidu模型具備文生視頻和圖生視頻能力,同時支持中英文指令輸入;在時長方面,Vidu在模型層面最長可支持一鍵32s視頻的生成;畫面質感方面,Vidu最高可輸出1080p分辨率。
生數科技方面表示,目前,影視、動畫、廣告等行業的企業機構普遍存在規模化視頻產出需求,Vidu API的開放,將助力這些企業在視頻生產環節降本增效,並激發創意。同時對於眾多開發者而言,Vidu API的開放也為探索AI 2.0應用提供了重要基礎。
生數科技認為,視頻大模型高度個性化、自動化的內容創作能力,將賦予企業在營銷、品牌推廣和內容創新等場景中的全新競爭力,視頻模型的引入將成為創意產業提升競爭力的關鍵因素。基於此背景,開放Vidu API成為生數科技進一步推進商業化佈局的重要戰略舉措。
2024年以來,視頻大模型的競爭日趨激烈,9月24日,字節跳動剛剛宣佈發佈了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前,行業內已有快手的視頻生成大模型「可靈」;同時,阿里旗下的通義萬相在9月宣佈全面升級,併發布全新視頻生成模型;圖像賽道的老玩家美圖秀秀同樣在9月宣佈旗下的美圖奇想大模型(MiracleVision)視頻生成能力全面升級。