四虎综合网,老子影院午夜伦不卡国语,色花影院,五月婷婷丁香六月,成人激情视频网,动漫av网站免费观看,国产午夜亚洲精品一级在线

每日經(jīng)濟(jì)新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

“即夢AI”上架,字節(jié)能否在視頻大模型上趕超快手?

每日經(jīng)濟(jì)新聞 2024-08-12 22:37:52

◎通過對即夢、可靈以及Sora的實(shí)際應(yīng)用對比,《每日經(jīng)濟(jì)新聞》記者體驗(yàn)發(fā)現(xiàn),三款視頻生成大模型在對提示詞的捕捉和理解上都較為準(zhǔn)確、完整,但即夢的人物塑造、內(nèi)容的豐富度和視頻流暢度等能力相對有所欠缺。在生成內(nèi)容的時長上,即夢支持最多12秒的視頻生成。

每經(jīng)記者 楊昕怡    每經(jīng)編輯 魏官紅    

“壓力給到了抖音剪映。”在今年6月以快手自研視頻生成大模型可靈為代表的現(xiàn)象級生成式AI(人工智能)產(chǎn)品涌現(xiàn)時,外界無一不在期待字節(jié)進(jìn)一步的表現(xiàn)。

近日,字節(jié)跳動旗下剪映團(tuán)隊(duì)研發(fā)的一站式AI創(chuàng)作平臺“即夢AI”移動版正式上架至蘋果App Store應(yīng)用商店。

《每日經(jīng)濟(jì)新聞》記者了解到,該應(yīng)用目前擁有文生圖和文/圖生視頻等功能。另外,即夢已經(jīng)上線會員體系,推出多個訂閱方式。

通過對即夢、可靈以及Sora的實(shí)際應(yīng)用對比,《每日經(jīng)濟(jì)新聞》記者體驗(yàn)發(fā)現(xiàn),三款視頻生成大模型在對提示詞的捕捉和理解上都較為準(zhǔn)確、完整,但即夢的人物塑造、內(nèi)容的豐富度和視頻流暢度等能力相對有所欠缺。在生成內(nèi)容的時長上,即夢支持最多12秒的視頻生成。

“生成流暢視頻的秒數(shù)是判斷一個視頻生成大模型能力優(yōu)劣的關(guān)鍵因素。”一位大模型工程師在接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,“‘流暢’需要從多個維度來看,比如生成的內(nèi)容有沒有事實(shí)錯誤、記憶能力如何以及空間感對不對等。”

“即夢AI”移動版上架 圖片來源:應(yīng)用截圖

“即夢AI”上架,效果趕超可靈?

今年年初,Sora的橫空出世開啟了“視頻的ChatGPT時代”,隨后,快手推出的“黑馬”可靈讓人們對國產(chǎn)AI視頻大模型的表現(xiàn)有了越來越多的期待。同為短視頻巨頭的抖音母公司字節(jié)跳動,則被視為賽道內(nèi)最具趕超可能性的選手之一。

可靈AI網(wǎng)頁端  圖片來源:官網(wǎng)截圖

3月底,字節(jié)旗下剪映團(tuán)隊(duì)研發(fā)的AI創(chuàng)作平臺“即夢AI”開放內(nèi)測;5月9日,該應(yīng)用上線網(wǎng)頁版,上線之初只有圖片生成、智能畫布和視頻生成三大功能,目前已上新故事創(chuàng)作功能;8月6日,該應(yīng)用移動版正式上架至蘋果App Store應(yīng)用商店,現(xiàn)擁有文生圖和文/圖生視頻等功能。

即夢AI網(wǎng)頁端  圖片來源:官網(wǎng)截圖

至于即夢的實(shí)際使用效果,今年7月初,全國首部AIGC生成式連續(xù)性敘事科幻短劇集《三星堆:未來啟示錄》在抖音上線。在這部總共13集的短劇集里,即夢作為首席AI技術(shù)支持方,借助了包括AIGC劇本創(chuàng)作、概念及分鏡設(shè)計(jì)、圖像到視頻轉(zhuǎn)換、視頻編輯和媒體內(nèi)容增強(qiáng)等10種AI技術(shù)。

據(jù)媒體報(bào)道,在和博納影業(yè)合作推出《三星堆:未來啟示錄》的過程中,即夢AI改進(jìn)了“視頻生成”功能,包括支持24fps、30fps、60fps的補(bǔ)幀以及二倍超分的能力,新增鏡頭水平移動、上下移動,支持鏡頭移動的方向和幅度控制等。

圖片來源:剪映微信公眾號截圖

在即夢App上線后,《每日經(jīng)濟(jì)新聞》記者選取了OpenAI官方公布的多條Sora視頻提示詞對即夢、可靈和Sora進(jìn)行對比測試。

從記者的測試結(jié)果來看,三款視頻生成大模型在對提示詞的捕捉和理解上都較為準(zhǔn)確、完整,生成視頻內(nèi)容的畫面表現(xiàn)也都連貫且流暢。

但在人物形象的刻畫精細(xì)度上,Sora相較于即夢和可靈有一定的優(yōu)勢;在動作的自然度上,即夢在三個測試產(chǎn)品中略遜一籌,例如在以“東京街頭的女士”為主題的視頻畫面呈現(xiàn)上,即夢生成的人物在轉(zhuǎn)頭時頭頸部略顯扭曲,拎包的手部動作也有所變形。

圖片來源:記者生成視頻截圖

而在生產(chǎn)內(nèi)容的元素豐富程度上,Sora也在三者中表現(xiàn)更優(yōu)。例如在以“太空人”為主題的生成視頻內(nèi)容里,Sora給出了飛船、艙外景象等多個有關(guān)提示詞的聯(lián)想內(nèi)容,而即夢和可靈僅呈現(xiàn)了一個穿著宇航服的男性角色。

圖片來源:記者生成視頻截圖

易觀分析研究合伙人陳晨在接受《每日經(jīng)濟(jì)新聞》記者采訪時表示,在生成效果上,即夢的AI圖像的整體質(zhì)量較好,AI視頻則在時長、元素豐富性、動作連貫性等細(xì)節(jié)處理上仍然有所欠缺。

“(元素內(nèi)容不夠豐富)更多有關(guān)模型的對齊,不過如果缺失了從‘太空人’聯(lián)想到‘飛船’的能力,是基座模型的能力問題。”一位大模型工程師向《每日經(jīng)濟(jì)新聞》記者指出,生成流暢視頻的秒數(shù)是判斷一個視頻生成大模型能力優(yōu)劣的關(guān)鍵因素,“‘流暢’需要從多個維度來看,比如生成的內(nèi)容有沒有事實(shí)錯誤、記憶能力如何以及空間感對不對等”。

《每日經(jīng)濟(jì)新聞》記者通過試用發(fā)現(xiàn),在輸入相同提示詞的情況下,要求生成的視頻越長,視頻主體形象和動作的精度、流暢程度很可能會相應(yīng)受損。

目前,即夢支持3秒、6秒、9秒和12秒的視頻內(nèi)容生成,分別對應(yīng)不同的積分消耗。而Sora早在發(fā)布時就已經(jīng)能合成1分鐘超長視頻;6月21日,可靈推出了圖生視頻功能,支持根據(jù)不同文本內(nèi)容,將靜態(tài)圖像轉(zhuǎn)化為生動的5秒視頻,且續(xù)寫功能可讓視頻延續(xù)約5秒,最長可生成約3分鐘視頻。

AI視頻,會是大模型的掘金點(diǎn)嗎?

Sora的出現(xiàn)無疑給大模型開辟了一方新的賽場——今年7月,阿里達(dá)摩院發(fā)布了一站式AI視頻創(chuàng)作平臺“尋光”,商湯推出了首個面向C端用戶的可控人物視頻生成大模型Vimi,智譜也宣布將AI生成視頻模型清影(Ying)正式上線智譜清言??

在AI頭部玩家集體向視頻生成大模型發(fā)起猛攻時,一個不能回避的問題就在眼前:AI視頻能讓大模型公司賺到錢嗎?

以業(yè)內(nèi)明星公司OpenAI為例,在推出了Sora等一眾能力領(lǐng)先的大模型的情況下,今年7月,有媒體援引知情人士以及未公開的內(nèi)部財(cái)務(wù)數(shù)據(jù)分析稱,OpenAI今年或面臨高達(dá)50億美元的巨額虧損,預(yù)估公司全年收入預(yù)估可能在35億~45億美元,遠(yuǎn)低于運(yùn)營成本。

同時,國內(nèi)視頻大模型在商業(yè)化落地上也顯得有些“著急”。7月30日,可靈上線了面向全球的會員體系,該體系與其在國內(nèi)市場推出的會員體系相仿,例如月卡分為10美元、37美元和92美元三檔,可對應(yīng)生成約66個、300個和800個5秒視頻。

《每日經(jīng)濟(jì)新聞》記者注意到,即夢也已推出會員體系,有79元單月、69元連續(xù)包月和659元包年的基礎(chǔ)會員的不同訂閱方式。具體來說,基礎(chǔ)會員每月可使用505個積分生成約2020張圖片或168個AI視頻。此外,還有每月2020個積分的標(biāo)準(zhǔn)會員和每月6555個積分的高級會員服務(wù)即將上線。

“由于AI大模型高昂的模型訓(xùn)練與推理成本,加之C端用戶對AI工具的需求相對分散,付費(fèi)意愿不足,視頻大模型在C端市場的商業(yè)化仍然會面臨一個較長的培育期。”陳晨認(rèn)為,對于C端市場而言,視頻大模型的商業(yè)化落地仍道阻且長。

而從B端市場出發(fā),陳晨向《每日經(jīng)濟(jì)新聞》記者表示,“對于B端而言,AI技術(shù)革命正在重塑原有的工作流程,壓縮冗余環(huán)節(jié)并引發(fā)新的創(chuàng)作工具需求。在這個過程中,AI視頻大模型可以逐步與現(xiàn)有的影視制作、廣告創(chuàng)意、媒體內(nèi)容策劃結(jié)合,輔助進(jìn)行復(fù)雜工序自動化處理和智能化內(nèi)容生產(chǎn)。而模型能力是否有效嵌入實(shí)際工作流程,帶來實(shí)質(zhì)性的效率提升、成本降低,是構(gòu)建商業(yè)化能力的關(guān)鍵因素”。

“Kimi的商業(yè)化會逐步開始探索,但還不是目前的重點(diǎn),目前的重點(diǎn)還是打造能力更強(qiáng)的下一代模型。”今年8月,月之暗面方面在接受《每日經(jīng)濟(jì)新聞》記者采訪時曾表示,現(xiàn)階段還不是以商業(yè)化為重的時候。

也許,對“初出茅廬”的即夢來說也是如此,它還有一個又一個里程碑要去觸達(dá)、超越。“即夢目前的產(chǎn)品功能、商業(yè)模式聚焦于服務(wù)UGC(用戶生成內(nèi)容),與抖音的生態(tài)融合也將是未來的發(fā)展重點(diǎn)。”陳晨表示,“或許在時長、幀率、畫面細(xì)節(jié)等技術(shù)參數(shù)上的直接對標(biāo)并不是即夢現(xiàn)階段最需要關(guān)注的,關(guān)鍵還是在于應(yīng)用落地和生態(tài)整合能力。”

封面圖片來源:視覺中國-VCG111299088149

如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

視頻 Ai 快手

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

0

0