安徽|北京|重慶|福建|甘肅|貴州|廣東|廣西|海南|河北|河南|湖北|湖南|黑龍江|江蘇|江西|吉林|遼寧|內蒙古|寧夏|青海|山東|山西|陜西|上海|四川|天津|新疆|兵團|云南|浙江

首頁 > 教育科技

人人拍出自己滿意的影視劇,Sora也不行?
2024年02月23日 10:23 中國新聞網(wǎng)

  中新網(wǎng)北京2月22日電(記者 袁秀月)“給它讀一遍《三國演義》試試”“《三體》可以直接小說轉電影了”……近日OpenAI發(fā)布首個文生視頻模型Sora,在網(wǎng)上迅速刷屏,不少網(wǎng)友躍躍欲試,期待將來用AI還原小說中的場景。

  還有人預測,以后人人都能拍出自己滿意的影視劇了。將來這會實現(xiàn)嗎?或者說,離實現(xiàn)這點還有多遠?

  把小說輸進AI,然后呢?

  在談論Sora之前,不得不提到,當前很多影視游戲行業(yè)人士已經(jīng)將AIGC(人工智能生成內容)應用于內容制作上。

  來自四川的博主馮先生(“AI瘋人院”)在CG領域工作了15年,從事過影視特效后期、游戲研發(fā)等。他表示,現(xiàn)在影視行業(yè)正廣泛接納AI的進入,目前主要應用于影視前期的概念設計、舞臺設計等,一些動畫團隊、游戲開發(fā)公司也正布局或引入AI生產(chǎn)線。

  馮先生最近在短視頻平臺發(fā)布了多條《西游記》系列AI概念動畫,獲得了近百萬的播放量。他告訴記者,他使用的工具是AI繪畫工具Midjourney和AI視頻生成工具Runway。

  “每個鏡頭要先構思好,然后通過Midjourney畫出畫面,一個鏡頭可能要畫上千張,最后選出一張,‘猴王問世’那集我畫了三四千張,最后選出一百個左右鏡頭,再把這些鏡頭拿給AI工具生成動畫,然后進行剪輯。臺詞先設計好,用AI配音來配,有些特殊的我會自己配音,再用變聲器調整效果!

  馮先生說,用AI制作這樣一段視頻需花費一周左右,但若人工制作可能需要幾個月。他表示,一般做動畫,需要概念設計、原畫、2D逐幀分鏡、3D場景搭建等流程,但如果有AI輔助的話,只需有原畫,AI就會幫你出畫面并生成動畫效果,中間過程會省去很多。

  而Sora的問世或將這個過程省去更多。在馮先生看來,Sora能夠在一個畫面里生成多個鏡頭,這是他以往使用的工具做不到的,這也就意味著將來能創(chuàng)作出更流暢、完整的作品。

  那么,把小說輸進去,能得到滿意的視頻嗎?馮先生認為,還需要一個過程,快的話可能等個三四年。“其實技術上的都不是難題,難在人類能夠理解各個不同國家的文學作品,了解它的背景和不同的文化元素,但AI還沒有很好理解這些東西!

  馮先生提到,在他用AI工具創(chuàng)作的過程中,能夠明顯感覺到它對不同文化的了解并不透徹,比如說中國文化,看起來風格相像,但仔細看衣服的紋飾和盔甲的造型并不真實存在。

  不過他也表示,AI的學習是呈指數(shù)級增長的,從畫面抽象到能理解畫面的豐富性和風格,僅迭代了一年多時間。Sora確實存在瑕疵,但這只是AI的迭代過程,在未來不是什么大事。

  Sora問世,人人成為導演?

  雖然目前Sora還未對公眾開放,但不少人認為其意義不亞于1年前ChatGPT的發(fā)布。從技術角度來講,Sora強在哪里?

  北京師范大學教育學部副教授張進寶表示,Sora采用了擴散模型和Transformer架構的結合(Diffusion Transformers, DiTs)。擴散模型通過逐漸添加噪聲來破壞圖像,然后學習逆向過程來恢復圖像。Transformer架構則可以捕捉圖像中的全局依賴關系。

  Sora的生成過程可以分為以下幾個步驟:將文本描述轉換為一系列的語義向量;將語義向量輸入到模型中,生成視頻的潛在表示;將潛在表示解碼為像素,生成最終的視頻。

  張進寶說,目前我們看到的是Sora使用了大量的視頻和圖像數(shù)據(jù)集進行訓練,包括電影、電視劇、紀錄片、游戲畫面等。這些數(shù)據(jù)集涵蓋了各種場景、人物和動作,為模型提供了豐富的學習素材。

  在他看來,Sora的誕生不僅標志著視頻生成技術的重大進步,也為內容創(chuàng)作、媒體、娛樂等行業(yè)帶來了前所未有的機遇和挑戰(zhàn)。例如:Sora的出現(xiàn)預示著視頻生成領域的競爭將變得更為激烈,推動多模態(tài)AI以及各種AI應用場景的快速發(fā)展,特別是在需要真實世界建模的行業(yè)。與傳統(tǒng)的影視制作相比,使用Sora的生產(chǎn)過程更簡單,投資成本更低,創(chuàng)意結果更快速。

  張進寶認為,Sora讓創(chuàng)作者可以更自由地使用AI工具表達自己的想法,減少了工業(yè)流程的約束,為內容創(chuàng)作提供了新的視角和工具。雖然目前Sora還無法完全取代傳統(tǒng)的影視制作,但其強大的能力表明,依靠AI輔助人類創(chuàng)造力的方向越來越明確,這可能會重新定義影視內容的創(chuàng)作和消費方式。

  “這也是AI引起那么多討論的原因之一,會給大家?guī)韷毫,其實我身邊的從業(yè)者基本沒受到影響,如果你是一個成熟有經(jīng)驗的美術或特效,并不會受到太大影響,它會成為你的一個輔助工具。”馮先生認為,即便有AI,人人成為導演也不現(xiàn)實,最后還是掌握在少數(shù)專業(yè)人的手里。

  中國影協(xié)科幻電影工作委員會執(zhí)行秘書長馬賀亮在接受媒體采訪時也表示,短期內與概念設計、視頻預覽相關的崗位會在一定程度上受到Sora的影響,但它所能呈現(xiàn)的效果其實還達不到院線電影的級別,而且電影在創(chuàng)作上有主觀立場、視角和表達,觀看時有情感交流和情感投射,遠不是簡單生成一段視頻就能代替,因此AI作為技術輔助手段的確已經(jīng)在改變電影制作方式與流程,能優(yōu)化提升電影創(chuàng)作,但要說它能“顛覆整個電影行業(yè)”,還為時過早。

  AI還有哪些可能性?

  “潘多拉的盒子既然已經(jīng)打開,指望它關上太不現(xiàn)實了。”在馮先生看來,除了繪畫、做視頻、文案等,AI還有更大的發(fā)展空間。

  “Sora模型所展示出的能力,可以讓人們進一步暢想更多的應用可能,為各個領域帶來新的變革和創(chuàng)新!睆堖M寶舉例,比如在教育領域中,可用于制作個性化的教學視頻,模擬實驗和場景,用于創(chuàng)建虛擬課堂,提供更加便捷的教育資源。

  在醫(yī)療領域,可用于制作醫(yī)學動畫,幫助醫(yī)生和患者更好地理解病情;模擬手術過程,幫助醫(yī)生進行術前規(guī)劃和訓練;進行遠程醫(yī)療,為偏遠地區(qū)患者提供便捷的醫(yī)療服務。在科研領域,可用于模擬科學實驗,生成科學數(shù)據(jù)可視化,構建虛擬世界,用于科學研究和探索。在商業(yè)領域,可用于制作產(chǎn)品宣傳視頻、創(chuàng)建虛擬展廳,用于市場調查和分析,幫助企業(yè)更好地了解客戶需求,等等。

  與此同時,Sora可能帶來的風險也備受關注,比如可能被用于造假或欺騙,Sora生成的內容可能存在偏見或錯誤,等等。法律界人士認為,隨著AI技術的發(fā)展,法律上的監(jiān)管也需要跟上。服務者或提供者在算法設計、訓練數(shù)據(jù)選擇、模型生成和優(yōu)化、提供服務等過程中,也需要采取有效措施防止產(chǎn)生各類歧視,同時避免制作、復制、發(fā)布、傳播虛假信息。

  在張進寶看來,智能化將全面滲透人類社會,人們將在廣泛使用各類智能技術提升競爭力與完成任務的過程中,學會理解技術、捕捉新興技術的潛力,推動社會有秩序的動態(tài)發(fā)展!安蹲娇萍及l(fā)展新動態(tài),在可控范圍內做出正確的決策,考驗的不僅僅是一個人,而是整個社會的應變能力。”(完)

責任編輯:崔景靚

友情鏈接: 中國政府網(wǎng) 陜西省人民政府 陜西省委統(tǒng)戰(zhàn)部 西安市人民政府 人民網(wǎng) 新華網(wǎng) 中央電視臺 央廣網(wǎng) 群眾新聞網(wǎng) 西部網(wǎng) 西安日報 華商網(wǎng) 西西新聞
本網(wǎng)站所刊載信息,不代表中新社和中新網(wǎng)觀點。 刊用本網(wǎng)站稿件,務經(jīng)書面授權。
未經(jīng)授權禁止轉載、摘編、復制及建立鏡像,違者將依法追究法律責任。
Copyright ©1999-2023 chinanews.com. All Rights Reserved