每日經濟新聞 2024-09-25 15:02:42
每經記者 可楊 每經編輯 梁梟
9月25日,生數科技聯合創始人兼CEO唐家渝在百度云智大會上宣布,生數科技旗下視頻大模型Vidu正式開放API(應用程序編程接口),并同步接入百度智能云千帆大模型平臺,成為平臺接入的首個視頻大模型。
生數科技作為國內最早布局多模態通用大模型的團隊之一,今年4月聯合清華大學發布了視頻大模型Vidu。
6月,生數科技完成數億元Pre-A輪融資,由百度、北京市人工智能產業投資基金領投,中關村科學城公司、啟明創投等跟投。彼時,生數科技方面曾表示,將基于百度百舸·AI異構算力平臺持續訓練、提升模型能力,并逐步通過百度智能云千帆平臺開放模型服務。
據唐家渝介紹,Vidu采用的架構是團隊純自研的U-ViT架構,是全球最早提出的Diffusion Transformer融合架構,早于Sora的DiT架構,這為通用生成任務奠定了重要基礎。
生數科技聯合創始人兼CEO唐家渝 圖片來源:企業供圖
他同時表示,Vidu模型具備文生視頻和圖生視頻能力,同時支持中英文指令輸入;在時長方面,Vidu在模型層面最長可支持一鍵32s視頻的生成;畫面質感方面,Vidu最高可輸出1080p分辨率。
生數科技方面表示,目前,影視、動畫、廣告等行業的企業機構普遍存在規模化視頻產出需求,Vidu API的開放,將助力這些企業在視頻生產環節降本增效,并激發創意。同時對于眾多開發者而言,Vidu API的開放也為探索AI 2.0應用提供了重要基礎。
生數科技認為,視頻大模型高度個性化、自動化的內容創作能力,將賦予企業在營銷、品牌推廣和內容創新等場景中的全新競爭力,視頻模型的引入將成為創意產業提升競爭力的關鍵因素。基于此背景,開放Vidu API成為生數科技進一步推進商業化布局的重要戰略舉措。
2024年以來,視頻大模型的競爭日趨激烈,9月24日,字節跳動剛剛宣布發布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前,行業內已有快手的視頻生成大模型“可靈”;同時,阿里旗下的通義萬相在9月宣布全面升級,并發布全新視頻生成模型;圖像賽道的老玩家美圖秀秀同樣在9月宣布旗下的美圖奇想大模型(MiracleVision)視頻生成能力全面升級。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP