視頻大模型Vidu正式開放API 生數科技商業化探索加速

2024-09-25 15:02

9月25日，生數科技聯合創始人兼CEO唐家渝在百度雲智大會上宣佈，生數科技旗下視頻大模型Vidu正式開放API（應用程序編程接口），並同步接入百度智能雲千帆大模型平臺，成為平臺接入的首個視頻大模型。

生數科技作為國內最早佈局多模態通用大模型的團隊之一，今年4月聯合清華大學發佈了視頻大模型Vidu。

6月，生數科技完成數億元Pre-A輪融資，由百度、北京市人工智能產業投資基金領投，中關村科學城公司、啟明創投等跟投。彼時，生數科技方面曾表示，將基於百度百舸·AI異構算力平臺持續訓練、提升模型能力，並逐步通過百度智能雲千帆平臺開放模型服務。

據唐家渝介紹，Vidu採用的架構是團隊純自研的U-ViT架構，是全球最早提出的Diffusion Transformer融合架構，早於Sora的DiT架構，這為通用生成任務奠定了重要基礎。

生數科技聯合創始人兼CEO唐家渝圖片來源：企業供圖

他同時表示，Vidu模型具備文生視頻和圖生視頻能力，同時支持中英文指令輸入；在時長方面，Vidu在模型層面最長可支持一鍵32s視頻的生成；畫面質感方面，Vidu最高可輸出1080p分辨率。

生數科技方面表示，目前，影視、動畫、廣告等行業的企業機構普遍存在規模化視頻產出需求，Vidu API的開放，將助力這些企業在視頻生產環節降本增效，並激發創意。同時對於眾多開發者而言，Vidu API的開放也為探索AI 2.0應用提供了重要基礎。

生數科技認為，視頻大模型高度個性化、自動化的內容創作能力，將賦予企業在營銷、品牌推廣和內容創新等場景中的全新競爭力，視頻模型的引入將成為創意產業提升競爭力的關鍵因素。基於此背景，開放Vidu API成為生數科技進一步推進商業化佈局的重要戰略舉措。

2024年以來，視頻大模型的競爭日趨激烈，9月24日，字節跳動剛剛宣佈發佈了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前，行業內已有快手的視頻生成大模型「可靈」；同時，阿里旗下的通義萬相在9月宣佈全面升級，併發布全新視頻生成模型；圖像賽道的老玩家美圖秀秀同樣在9月宣佈旗下的美圖奇想大模型（MiracleVision）視頻生成能力全面升級。

視頻大模型Vidu正式開放API 生數科技商業化探索加速

推薦文章

不止邁威爾科技！黃仁勛點名超30只「AI工廠」產業鏈公司，年內最高已搶跑480%漲幅

6月金股一圖睇完 | 騰訊領銜「科網老登」集體反彈？科指月內累漲4%，機構稱AI仍為核心增長引擎！

華盛早報 | 光通信利好連發！國產技術重要突破 + 邁威爾引爆美股+ 英偉達硅光量產；微軟聯手英偉達重新發明電腦；SpaceX擬定價135美元

6月3日外盤頭條：特朗普簽署AI行政令加強政府監管 微軟發佈全新AI模型 SpaceX要求壓低IPO承銷費率

港股盤中持續拉昇！恆指漲超1.4%，科指漲超3.5%；美團績后漲超8%，騰訊漲超7%，比亞迪股份漲逾5%

華盛早報 | 英偉達殺入PC芯片引爆產業鏈，ARM漲近16%；谷歌擬籌800億美元押注AI！伯克希爾重金入局；美團環比大幅減虧超百億

一圖看懂 | 外賣大戰趨緩！美團Q1調后淨虧49.7億，環比大幅減虧超百億；管理層稱補貼將更審慎

華盛早報 | 今天11點！黃仁勛發表重磅演講，即將攜手微軟發佈新款PC？馬斯克闢謠SpaceX估值下調；美團盤后放榜

6月3日外盤頭條：特朗普簽署AI行政令加強政府監管微軟發佈全新AI模型 SpaceX要求壓低IPO承銷費率