吴梦梦av一区二区三区,啊啊啊啊操我好爽视频在线观看,国产乱乱无码,久久精品亚洲天堂av

每日經(jīng)濟新聞
今日報紙

每經(jīng)網(wǎng)首頁 > 今日報紙 > 正文

字節(jié)豆包直面AI視頻降本難題,壓力給到了誰?

每日經(jīng)濟新聞 2024-10-21 21:49:01

每經(jīng)記者 楊昕怡    每經(jīng)編輯 魏官紅    

自Sora橫空出世開辟AI視頻的新紀元以來,國內(nèi)外各大玩家陸續(xù)加入AI視頻的競逐賽。但是,當進入這一更交互、更沉浸的視頻新時代,又該如何應對成本、質(zhì)量和性能方面的挑戰(zhàn)?

10月15日,火山引擎聯(lián)合英特爾共同在視頻云技術(shù)大會上發(fā)布了大模型訓練視頻預處理方案。《每日經(jīng)濟新聞》記者在發(fā)布會現(xiàn)場了解到,目前該技術(shù)方案已應用于豆包視頻生成模型。

發(fā)布會上,Bytedance Research負責人李航介紹,豆包視頻生成模型PixelDance在訓練過程中采用了火山引擎的大模型訓練視頻預處理方案,充分利用了大量潮汐資源,為模型訓練提供了有力支撐。

此外,抖音集團視頻架構(gòu)負責人王悅透露了字節(jié)自研視頻編解碼芯片的最新進展:經(jīng)過抖音集團內(nèi)部的實踐驗證,該芯片在同等視頻壓縮效率下,成本節(jié)省了95%以上。

“首先,超大規(guī)模視頻訓練數(shù)據(jù)集導致計算和處理成本激增。”王悅指出,大模型廠商在預處理過程中面臨諸多挑戰(zhàn),“其次是視頻樣本數(shù)據(jù)參差不齊,然后是處理鏈路環(huán)節(jié)多、工程復雜,最后還面臨著對GPU、CPU、ARM等多種異構(gòu)算力資源的調(diào)度部署。”

自研多媒體處理框架

在9月24日的火山引擎AI創(chuàng)新巡展上,PixelDance和Seaweed兩款豆包視頻生成大模型一并發(fā)布,吸引業(yè)內(nèi)外人士關注。其實,字節(jié)跳動在視頻生成模型上下的功夫不止于此。

10月15日,火山引擎發(fā)布了大模型訓練視頻預處理方案,致力于解決視頻大模型訓練的成本、質(zhì)量和性能等方面的技術(shù)挑戰(zhàn)。

據(jù)介紹,對訓練視頻進行預處理是保障大模型訓練效果的重要前提。預處理過程可以統(tǒng)一視頻的數(shù)據(jù)格式、提高數(shù)據(jù)質(zhì)量、實現(xiàn)數(shù)據(jù)標準化、減少數(shù)據(jù)量以及處理標注信息,從而使模型能更高效地學習視頻中的特征和知識,提升訓練效果和效率。

在視頻生成模型的訓練中,算力成本無疑是首屈一指的挑戰(zhàn)。

一位國內(nèi)視頻生成模型的算法工程師在接受《每日經(jīng)濟新聞》記者采訪時表示,在擁有高質(zhì)量數(shù)據(jù)后,視頻模型會比大語言模型更難訓練,有更多的算力需求,“目前已知的開源視頻模型沒有特別大,主要是目前很多視頻模型處于不知道如何使用數(shù)據(jù)的階段,(用于訓練的)高質(zhì)量數(shù)據(jù)也沒有特別多”。

計算機科學家 Matthias Plappert的研究也顯示,Sora的訓練對算力規(guī)模需求巨大,在訓練環(huán)節(jié)大約需要在4200~10500張NVIDIA H100上訓練1個月,且當模型生成到推理環(huán)節(jié)以后,計算成本將迅速超過訓練環(huán)節(jié)。

為了解決降本難題,火山引擎借助Intel的CPU等資源,將大模型訓練視頻預處理方案依托于自研的多媒體處理框架。王悅表示,該方案還在算法和工程方面進行了調(diào)優(yōu),可以對海量視頻數(shù)據(jù)進行高質(zhì)量預處理,短時間內(nèi)實現(xiàn)處理鏈路的高效協(xié)同,提高模型訓練效率。

對于該方案的應用,李航在發(fā)布會現(xiàn)場透露,豆包視頻生成模型PixelDance在訓練過程中已采用該方案。同時,火山引擎視頻云團隊提供的點播解決方案還為PixelDance生產(chǎn)的視頻提供了從編輯、上傳、轉(zhuǎn)碼、分發(fā)、播放的全生命周期一站式服務,讓模型的商業(yè)化應用有了保障。

此外,在此次發(fā)布會上,火山引擎還發(fā)布了跨語言同聲復刻直播方案、多模態(tài)視頻理解與生成方案、對話式AI實時交互方案和AIG3D&大場景重建方案,從視頻的生產(chǎn)端、交互端到消費端,全鏈路融入AI能力。

AI視頻去向何方?

AI正全方位重塑人們生產(chǎn)、傳播和接受信息的路徑。其中,不斷涌現(xiàn)的視頻新技術(shù)將人們從流暢、高清的數(shù)據(jù)世界帶入了更加智能、更具交互體驗的AI世界。

今年7月,商湯推出了首個面向C端用戶的可控人物視頻生成大模型Vimi;8月,MiniMax發(fā)布了視頻生成模型video-1;9月,可靈AI完成第九次迭代,發(fā)布“可靈1.5模型”,阿里云在云棲大會上推出全新的視頻生成模型,字節(jié)也發(fā)布了2款視頻生成模型。AI視頻產(chǎn)品的誕生和迭代幾乎是以月來計時的。

對于AI視頻產(chǎn)品的“爆發(fā)”,北京市社會科學院副研究員王鵬在接受《每日經(jīng)濟新聞》記者采訪時表示,國內(nèi)AI視頻產(chǎn)品正處于快速發(fā)展和不斷迭代的階段,主要因為市場需求旺盛、應用場景廣泛和商業(yè)化模式多樣等。

目前市場上AI視頻產(chǎn)品的落地大多在影視、電商營銷等領域,例如今年7月,即夢AI和博納影業(yè)合作推出了全國首部AIGC生成式連續(xù)性敘事科幻短劇集《三星堆:未來啟示錄》;今年9月,快手聯(lián)合賈樟柯、李少紅等9位知名導演啟動“可靈AI”導演共創(chuàng)計劃。

工信部信息通信經(jīng)濟專家委員會委員盤和林向《每日經(jīng)濟新聞》記者指出,如今部分AI視頻產(chǎn)品處于導入期,因為技術(shù)或合規(guī)性,很難在市場上鋪開,“目前感覺開源(AI視頻產(chǎn)品)比閉源的更受歡迎,因為AI視頻生成的成本很高,而視頻制作者往往缺少資金,所以利用開源的、下載到終端的AI算法可以更好地制作生成視頻”。

在他看來,現(xiàn)階段AI視頻產(chǎn)品主要有算力和合規(guī)風險兩方面的障礙。“算法、算力和數(shù)據(jù)方面都需要企業(yè)投入較多的資源和時間;另一難點在于合規(guī)風險,如今對隱私越來越重視,合規(guī)是繞不過去的話題,而AI視頻有時可能會侵犯個人隱私。”他解釋稱。

此外,易觀分析研究合伙人陳晨也在接受《每日經(jīng)濟新聞》記者采訪時表達了對視頻生成大模型短期變現(xiàn)能力的擔憂,“由于AI大模型高昂的模型訓練與推理成本,加之C端用戶對AI工具的需求相對分散,付費意愿不足,視頻大模型在C端市場的商業(yè)化仍然會面臨一個較長的培育期”。

AI視頻的時代來到了,但如何降本增效、拿下更多市場也將成為互聯(lián)網(wǎng)大廠和科技企業(yè)面對的重要命題。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

視頻 模型 Ai

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0

日韩精品国产精品乱码涩涩| 下身被黑人粗暴进入| 无码人妻av一区二区三区蜜臀 | 在线无码中文字幕一区| 久久综合精品国| AV一区二区免费| 男人都懂的半夜视频在线观看| 国产嫩苞又嫩又紧AV在线| 久久久综合亚洲色一区二区三区| 日日夜夜狠狠久久骚骚| 亚州中文色视频| 天天影视色香欲综合| 青青草原欧美视频| 日韩特黄精品视频免费在线看| 久久涩涩涩涩| 99riav国产精品视频一区| 亚洲毛片无码专区| 三级片中文在线| 亚洲愉拍自拍另类天堂| 亚洲精品播放器| 爱神马久久| 粉嫩av一区二区三区天美传媒| 蜜桃2| 国产乱码精品一区二区三区中文| 9999永久免费精品视频| 九色综合第一页| 国产熟女91熟女| 在线国产观看一区| 丁香五月欧美六月久久| 亚洲自拍图中文字幕| 日本乱伦欲望视频网| 欧美一级黄色一区二区视频真人| 免费四虎网站| 欧美永久精品免费| 色众合 性| 日韩精品一区二区三区视频 | 噜噜噜无码视频免费观看| 国产免费内射视频| 亚洲a黄| 免费黄网站入口| 一级日B在线|