要聞

視頻大模型Vidu正式開放API 生數科技商業化探索加速

每日經濟新聞 2024-09-25 15:02:42

每經記者可楊每經編輯梁梟

9月25日，生數科技聯合創始人兼CEO唐家渝在百度云智大會上宣布，生數科技旗下視頻大模型Vidu正式開放API（應用程序編程接口），并同步接入百度智能云千帆大模型平臺，成為平臺接入的首個視頻大模型。

生數科技作為國內最早布局多模態通用大模型的團隊之一，今年4月聯合清華大學發布了視頻大模型Vidu。

6月，生數科技完成數億元Pre-A輪融資，由百度、北京市人工智能產業投資基金領投，中關村科學城公司、啟明創投等跟投。彼時，生數科技方面曾表示，將基于百度百舸·AI異構算力平臺持續訓練、提升模型能力，并逐步通過百度智能云千帆平臺開放模型服務。

據唐家渝介紹，Vidu采用的架構是團隊純自研的U-ViT架構，是全球最早提出的Diffusion Transformer融合架構，早于Sora的DiT架構，這為通用生成任務奠定了重要基礎。

生數科技聯合創始人兼CEO唐家渝圖片來源：企業供圖

他同時表示，Vidu模型具備文生視頻和圖生視頻能力，同時支持中英文指令輸入；在時長方面，Vidu在模型層面最長可支持一鍵32s視頻的生成；畫面質感方面，Vidu最高可輸出1080p分辨率。

生數科技方面表示，目前，影視、動畫、廣告等行業的企業機構普遍存在規模化視頻產出需求，Vidu API的開放，將助力這些企業在視頻生產環節降本增效，并激發創意。同時對于眾多開發者而言，Vidu API的開放也為探索AI 2.0應用提供了重要基礎。

生數科技認為，視頻大模型高度個性化、自動化的內容創作能力，將賦予企業在營銷、品牌推廣和內容創新等場景中的全新競爭力，視頻模型的引入將成為創意產業提升競爭力的關鍵因素。基于此背景，開放Vidu API成為生數科技進一步推進商業化布局的重要戰略舉措。

2024年以來，視頻大模型的競爭日趨激烈，9月24日，字節跳動剛剛宣布發布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前，行業內已有快手的視頻生成大模型“可靈”；同時，阿里旗下的通義萬相在9月宣布全面升級，并發布全新視頻生成模型；圖像賽道的老玩家美圖秀秀同樣在9月宣布旗下的美圖奇想大模型（MiracleVision）視頻生成能力全面升級。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

大模型

上一篇文章

9月25日上證指數收盤上漲1.16%，創業板指上漲1.62%，深證成指上漲1.21%

返回每經網首頁

下一篇文章

國內商品期貨收盤純堿漲超5%