<strike id="2uuuc"></strike>
<th id="2uuuc"><menu id="2uuuc"></menu></th>
<sup id="2uuuc"></sup>
  • <samp id="2uuuc"><tbody id="2uuuc"></tbody></samp>
    <ul id="2uuuc"><tbody id="2uuuc"></tbody></ul>
    <samp id="2uuuc"><tbody id="2uuuc"></tbody></samp>
    <samp id="2uuuc"><tbody id="2uuuc"></tbody></samp>
  • 每日經(jīng)濟新聞
    要聞

    每經(jīng)網(wǎng)首頁 > 要聞 > 正文

    對話生數(shù)科技CEO唐家渝:AI視頻到了“普及”節(jié)點,提升時長不是產(chǎn)品化的重點

    每日經(jīng)濟新聞 2024-09-12 21:26:32

    每經(jīng)記者 李少婷  可楊    每經(jīng)編輯 段煉 文多    

    9月11日,生數(shù)科技舉辦媒體開放日活動,發(fā)布“主體參照”(Subject Consistency)功能,意在破解視頻模型生成主體的“一致性”難題。

    活動上,生數(shù)科技聯(lián)合創(chuàng)始人、CEO唐家渝在回應《每日經(jīng)濟新聞》記者關于商業(yè)模式的提問時表示,目前行業(yè)內(nèi)有SaaS(軟件即服務)訂閱和MaaS(模型即服務)兩種,7月30日Vidu上線以來,在全球范圍內(nèi)已收到數(shù)萬個API接入申請。

    就底層架構,唐家渝表示旗下產(chǎn)品“VIDU”所用的“U-ViT架構”與Sora所用的“DiT架構”幾乎一模一樣,差別在于U-ViT作了更多面向落地的設計。在技術路線上,大家現(xiàn)在處于底層架構收斂的狀態(tài),但同質(zhì)化并不代表大家所有進展、能力相同,唐家渝舉例說:“例如現(xiàn)在的語言模型,(雖然)大家都使用Transformer架構,但從現(xiàn)實來看,OpenAI還是明顯領先的。”

    目前,AI視頻的主要使用者還是專業(yè)用戶,如電影工作者等,但唐家渝認為,AI視頻已經(jīng)來到了“普及”的節(jié)點。

    此外,從當前階段的收入來說,生數(shù)科技在B端市場獲得的收入更多,C端的增長曲線則在Vidu產(chǎn)品上市這一個月以來非?!岸盖汀?。

    CFF20LXzkOxnlfBbXURpd39MVKpibQiaWDZgrejlYrIYScSpNR0VlBRDgccdFPHr3Ojaqx5DDBaLSvpiaE4r9gVibw.jpg

    唐家渝 圖片來源:每經(jīng)記者 李少婷 攝

    CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

    “最終的目標還是做通用大模型”

    唐家渝是清華大學自然語言處理實驗室碩士,此前曾任瑞萊智慧副總裁、騰訊優(yōu)圖實驗室高級產(chǎn)品經(jīng)理等。唐家渝目前所在的生數(shù)科技于2023年3月成立,今年3月初宣布完成新一輪融資。今年4月底,該公司與清華大學聯(lián)合研發(fā)的原創(chuàng)視頻大模型Vidu面向全球發(fā)布,7月底正式上線,全面開放使用。

    Vidu問世即被稱為“中國版Sora”。這種稱呼一方面是因為外界對中國視頻大模型充滿期待,另一方面,從技術架構上說,二者也有異曲同工之處。

    據(jù)介紹,Vidu的底層基于自研的U-ViT架構,而Sora是基于DiT架構。關于U-ViT與DiT架構的區(qū)別,唐家渝介紹:“一句話總結來說,幾乎一模一樣。”二者都是Diffusion和Transformer的融合,甚至底層一些技術細節(jié)也是相同的。不同之處在于,U-ViT架構“做了更多面向落地的優(yōu)化設計”,簡單概括下來,就是在訓練同一模型時,相同時間下,U-ViT所需的算力更少。

    從整體的技術路線來看,當前國內(nèi)幾家視頻大模型都走的是“類Sora路線”,那大家未來是否會愈加同質(zhì)化?

    對此,唐家渝介紹,當前大家是處于底層架構收斂的狀態(tài)中,“但同質(zhì)化并不代表大家所有進展、能力都相同”。他以語言模型為例分析道,大家都會使用Transformer架構,但從現(xiàn)實情況來看,OpenAI還是明顯領先,這是因為在這一架構基礎上仍有諸多環(huán)節(jié)需要技術技巧、實踐經(jīng)驗幫助破解難點,這就導致了不同語言模型在能力上的差距。

    當前,業(yè)內(nèi)也在探索新的架構路線,例如將多模態(tài)的生成和多模態(tài)理解結合起來,但目前仍沒有特別好的方案出現(xiàn)。

    “我們最終的目標還是做通用大模型,視頻生成是多模態(tài)生成大模型中間的一個階段。”唐家渝坦承了開發(fā)通用大模型的雄心。

    他還表示:“這并不意味著我們完全只在做這一個事情(指視頻大模型),我們除了視頻以外也有其他模態(tài)的生成能力?!?/span>

    CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

    “目前B端市場收入更多”

    技術底層邏輯的趨同,也或多或少低導致了市場開發(fā)思路相近。

    “大家的商業(yè)選擇上還是比較類似的,即便是像Sora、Runway,都在積極地擁抱好萊塢或者廣告合作等方向?!碧萍矣逭J為,AI生成視頻領域總的來說還處在發(fā)展前期,國際頭部玩家在齊頭并進,或者叫“共同擴大市場”。

    以生數(shù)科技為例,唐家渝將落地商業(yè)模式分為兩個方向:其一是SaaS訂閱模式,Vidu每個月有一些免費的額度,但是如果有更多的需求或想使用更高級的能力,就需要支付訂閱費用,Vidu也會不斷豐富產(chǎn)品功能,以滿足用戶的創(chuàng)作需求;其二是模型能力輸出模式(MaaS),當前不少客戶需要視頻生成能力,以此作為工作流程的一個環(huán)節(jié)或者來衍生出有意思的玩法,這些客戶希望可以直接調(diào)用模型。

    從收入角度來看,B端市場在目前這個階段獲得的收入更多。不過Vidu上線一個月來,C端的增長曲線也非常“陡峭”?!拔覀兡壳芭袛嘞聛淼脑?,B端(的需求)是比較明確、比較直接和比較穩(wěn)定的,所以B端是我們的一個長期、重點方向。C端我們也在不斷探索。”唐家渝表示。

    當前,國內(nèi)的視頻生成模型和工具已形成“出海潮”,并且表現(xiàn)亮眼,但唐家渝認為:“還不能說國內(nèi)已經(jīng)完全領先,國內(nèi)外頭部玩家都屬于第一梯隊。”

    CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

    “AI視頻來到了一個節(jié)點”

    視頻大模型的受眾群體中,影視、動漫從業(yè)者居多,他們多被視為“專業(yè)受眾”,那對“普通人”來說,AI視頻何時能成為他們可以駕馭的工具?

    唐家渝以攝影為例,從膠片機時代到手機攝影普及,就是一個不斷降低創(chuàng)作者門檻的過程。“現(xiàn)在的AI視頻來到了一個節(jié)點。”唐家渝介紹,9月11日,生數(shù)科技發(fā)布的“主體參照”功能,正是為降低創(chuàng)作者門檻或者加速創(chuàng)作過程所作的努力。

    “技術仍是關鍵因素,目前的視頻生成只是初步符合物理規(guī)律,還有很高的天花板需要突破,比如更強的模型能力以及更多模態(tài)的協(xié)同生成?!碧萍矣褰榻B,這次發(fā)布的“主體參照”能力在一致性生成方面確實有了很大提升,但是還有很多地方需要進一步提升?!袄缫竽P蛷纳梢粋€商品變成生成一個工藝品,而這個工藝品上面有繁復花紋和鏤空部分,面對如此復雜的結構,目前的生成成功率依舊不高。場景生成包含很多組成因素,例如運動鞋,我就希望它能在更復雜、更動態(tài)化的場景中有更好的表現(xiàn)。這些都需要不斷提升模型能力?!?/span>

    這個過程中,技術的原創(chuàng)性和突破性需要與良好的商業(yè)化齊頭并進,因為商業(yè)公司畢竟不是科研機構。

    以視頻生成的時長為例,拓展生成時長需要提升模型對世界抽象理解的能力、信息壓縮和放大的雙向能力。當前Vidu最長可以生成32秒的視頻,生數(shù)科技計劃將其擴展得更長,不過,時長還不是生數(shù)科技現(xiàn)在重點產(chǎn)品化的部分。

    “在實際創(chuàng)作中,粗略地來說,90%以上的片段都是幾秒鐘。因此,從實用角度來看,我們還沒有將時長作為我們的優(yōu)先發(fā)布考慮。”唐家渝強調(diào),但從模型能力角度,公司實際上在持續(xù)提升。

    記者|李少婷?可楊

    編輯|段煉 文多?杜恒峰

    校對|王月龍

    CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

    |每日經(jīng)濟新聞 ?nbdnews??原創(chuàng)文章|

    未經(jīng)許可禁止轉載、摘編、復制及鏡像等使用

    如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
    未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

    讀者熱線:4008890008

    特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

    歡迎關注每日經(jīng)濟新聞APP

    每經(jīng)經(jīng)濟新聞官方APP

    0

    0

    主站蜘蛛池模板: 人妻无码一区二区视频| 中日精品无码一本二本三本| 久久久久无码精品亚洲日韩| 无码日韩精品一区二区三区免费 | 无码人妻久久一区二区三区| 精品无人区无码乱码大片国产| 无码无遮挡又大又爽又黄的视频 | 国产精品JIZZ在线观看无码| 夜夜添无码试看一区二区三区| 人妻少妇精品无码专区动漫| 无套内射在线无码播放| 亚洲一区精品无码| 无码日韩精品一区二区人妻| 亚洲人片在线观看天堂无码| 亚洲AV无码成人网站久久精品大| 少妇无码太爽了不卡视频在线看| 精品无码国产自产在线观看水浒传| a级毛片无码免费真人久久| 亚洲精品无码久久毛片波多野吉衣| 国产精品无码素人福利| 精品无码中文视频在线观看| 99久久无码一区人妻a黑| 午夜不卡久久精品无码免费| 在线观看片免费人成视频无码| 精品无码中文视频在线观看| 无码喷水一区二区浪潮AV| 久久久无码精品亚洲日韩按摩| 中文有码vs无码人妻| 国产成人无码久久久精品一| 日韩精品无码一区二区三区四区| 国产精品无码av天天爽| 国产成人精品无码一区二区老年人| 亚洲爆乳大丰满无码专区| 伊人无码精品久久一区二区| 91无码人妻精品一区二区三区L| 久久Av无码精品人妻系列| 亚洲av永久无码一区二区三区| 免费A级毛片无码无遮挡内射| 在线精品自偷自拍无码中文| 无码h黄肉3d动漫在线观看| av无码aV天天aV天天爽|