每日經(jīng)濟(jì)新聞 2024-12-10 19:42:26
12月10日凌晨,OpenAI正式推出視頻生成工具Sora的高端加速版——Sora Turbo,距首次預(yù)告Sora已過300天。利用該工具,用戶可以通過文字、圖像或其他視頻素材,生成長達(dá)20秒的視頻。Sora的推出受到廣泛歡迎,服務(wù)器直接被擠到崩潰。從用戶分享的視頻看,Sora的生成效果還是很不錯,但有用戶指出,其依然面臨著物理規(guī)則理解的挑戰(zhàn)。
每經(jīng)記者 蔡鼎 每經(jīng)實習(xí)記者 岳楚鵬 每經(jīng)編輯 蘭素英
12月10日凌晨,OpenAI的12天特別活動的第3天,備受外界期待的視頻生成工具Sora終于正式登場。
Sora的首次預(yù)告是在2月16日,當(dāng)時OpenAI提供了數(shù)十個演示視頻,展示了一個令人驚嘆的未來:任何人都可以通過在計算機(jī)程序中輸入簡單的文本提示來制作高質(zhì)量的短片。
然而,在隨后的300天內(nèi),Sora始終停留在預(yù)告階段,未能面世。而在這期間,包括Meta、谷歌和亞馬遜在內(nèi)的幾家大型科技公司都展示了自己的視頻生成模型,國內(nèi)的可靈和海螺也在海外大放異彩,成為外網(wǎng)一度討論最熱烈的視頻生成模型。
采用最新發(fā)布的Sora Turbo,用戶可以通過文字、圖像或其他視頻素材,生成長達(dá)20秒的視頻。目前,該工具已在美國和其他部分市場面向ChatGPT Plus和Pro用戶開放。
Sora官網(wǎng)上線后,用戶蜂擁而入,火爆的需求很快就導(dǎo)致網(wǎng)站崩潰,公司CEO山姆·奧爾特曼(Sam Altman)表示:“我們嚴(yán)重低估了Sora的需求,要讓每個人都能訪問還需要一段時間。”
而拿到訪問權(quán)限的用戶也在網(wǎng)上陸續(xù)分享Sora生成的視頻,不難看出,Sora還是有不少驚喜,但有用戶也反饋稱,Sora對物理規(guī)律的理解并不夠好,仍會出現(xiàn)人的手部不自然、文字亂碼、動物跑著跑著就飛起來等情況。
12月10日凌晨,OpenAI正式發(fā)布Sora Turbo。這距離該公司首次公開發(fā)布這一產(chǎn)品的預(yù)覽已經(jīng)過去300天。
目前,http://sora.com網(wǎng)站已經(jīng)上線,美國及其他市場的ChatGPT付費(fèi)用戶可以通過該網(wǎng)站開始使用Sora,但在歐洲大部分地區(qū)和英國還需要一段時間才能使用。相比最初預(yù)告的Sora版本,Sora Turbo模型增加了文本生成視頻、動畫圖像和混合視頻等功能。
OpenAI表示,ChatGPT Plus訂閱用戶可以生成最多50個視頻,分辨率最高可達(dá)720p,時長為5秒。而通過上周推出的“史上最貴”的、每月收費(fèi)200美元的ChatGPT Pro服務(wù),用戶最多可以生成500個視頻,可以同時生成5個視頻,時長為20秒,分辨率最高為1080p,并且,訂閱者可以下載沒有水印的視頻。
圖片來源:OpenAI
奧爾特曼與Sora團(tuán)隊負(fù)責(zé)人比爾·皮布爾斯(Bill Peebles)、阿迪亞·拉梅什(Aditya Ramesh)進(jìn)行了約20分鐘的直播對Sora進(jìn)行介紹。在直播中,他們展示了Sora的新探索頁面,其中包含一些用戶制作的AI生成的視頻。
OpenAI重點(diǎn)介紹了一項名為“故事板”的功能,該功能可讓用戶根據(jù)一系列提示生成視頻,以及將照片轉(zhuǎn)換為視頻。OpenAI還演示了一個“混合”工具,可讓您使用文本提示調(diào)整Sora的輸出,還可以將兩個場景“混合”在一起生成一個新的場景。
圖片來源:X
對于Sora的發(fā)布以及意料之外的視頻編輯功能,著名AI評論員Rowan Cheung評價道:“圣誕節(jié)提前來到了AI世界”。
圖片來源:X
針對之前一直被提及的安全問題,OpenAI表示,使用Sora生成的視頻將帶有可見的水印和C2PA元數(shù)據(jù),以表明它們是使用AI制作的。在將圖像或視頻上傳到Sora之前,OpenAI會提示您勾選一項協(xié)議,該協(xié)議規(guī)定您上傳的內(nèi)容不包含未成年人、露骨或暴力內(nèi)容以及受版權(quán)保護(hù)的材料。OpenAI表示,“濫用媒體上傳”可能會導(dǎo)致帳戶被禁止或暫停。
Sora的產(chǎn)品負(fù)責(zé)人Rohan Sahai表示:“我們面臨著巨大的壓力,我們希望防止Sora的非法活動,但我們也希望在創(chuàng)造性表達(dá)與非法活動之間取得平衡。”
奧爾特曼在直播中表示,對于OpenAI而言,Sora不僅僅是一項技術(shù),更是一種賦能創(chuàng)意人士的工具。在OpenAI的文化基因中,用AI激發(fā)人類創(chuàng)造力也很重要。通過Sora,OpenAI看到了AI和人類共同創(chuàng)造的全新協(xié)作模式。文本曾是人機(jī)交互主要形式,但他們堅信這遠(yuǎn)遠(yuǎn)不夠,視頻能夠傳遞更多的情感和細(xì)節(jié)。同時,Sora對于OpenAI而言,不僅僅是一個視頻生成工具,更是AGI(通用人工智能)之路的重要里程碑。
Sora官網(wǎng)上線后,不少用戶蜂擁而入,希望成為第一批體驗該模型的幸運(yùn)兒。結(jié)果,由于需求量太大,OpenAI不得不暫時關(guān)閉了Sora帳戶的創(chuàng)建功能。
奧爾特曼在X平臺上發(fā)文稱,“我們嚴(yán)重低估了Sora的需求,要讓每個人都能訪問還需要一段時間。正在試圖找出如何盡快做到這一點(diǎn)!”
圖片來源:X
OpenAI暫時沒有回應(yīng)在關(guān)閉之前到底有多少人成功創(chuàng)建賬戶,也沒有透露何時恢復(fù)創(chuàng)建賬戶功能,但獲得了訪問權(quán)限的用戶正在社交媒體上分享他們的作品。
有用戶完全模擬了一個玫瑰從花蕾綻放到盛開的延時視頻,看上去就和紀(jì)錄片里的一模一樣。
圖片來源:X
還有網(wǎng)友模擬了80年代日本繁忙的街頭。
圖片來源:X
知名科技博主MKBHD也放出了一段模擬真實新聞的視頻。除了字幕有一點(diǎn)亂碼以外,其他和真實新聞場景看上去沒有什么區(qū)別。
圖片來源:X
OpenAI員工Will Depue也放出了一段它模擬的生成的一段虛假的歷史視頻,真實和虛幻之間感覺已經(jīng)快分不開了。
圖片來源:X
不過也有人反饋,Sora對物理規(guī)律的理解并不夠好,仍會出現(xiàn)人的手部不自然、文字亂碼、動物跑著跑著就飛起來等情況。比如,在上面?zhèn)卧斓臍v史視頻中,如果仔細(xì)看其實會發(fā)現(xiàn)中間有一個騎兵是倒著騎馬的。
還有網(wǎng)友將Sora和在之前在國外大火的海螺模型和Sora做比較,用相同的提示詞來生成一段末日機(jī)器人視頻。
圖片來源:X
Sora版本
海螺版本
更有人直接把海外最熱門的幾個生成模型(可靈,Sora,Runway,海螺)拉在一起比較,最后得出結(jié)論:從電影制作的角度來看,可靈的效果最實用;Sora的效果最好(但如果鏡頭不正確,一切都不正確);海螺在某些情況下很好,但感覺很弱且不一致;Runway在工作流程方面是最好的,但它并不可控的。AI視頻生成本身就是迭代的,因此與緩慢、漂亮但不正確的相比,快速和精簡是一個不錯的功能。
圖片來源:X
Sora版本
可靈版本
海螺版本
怪不得有網(wǎng)友評論道:“每個人都對OpenAI Sora感到興奮,但目前對我來說,最適合制作視頻還得是海螺和可靈”。
圖片來源:X
隨著Sora的面世,視頻生成大模型的賽道競爭無疑將會越來越激烈。上周,騰訊也發(fā)布了參數(shù)量高達(dá)130億的元寶AI視頻生成模型,是當(dāng)前最大的視頻開源模型。
圖片來源:騰訊元寶
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP