Open AI日前再次放大招,推出了一款視頻生成模型——Sora。據(jù)了解,Sora可以根據(jù)文本生成長達一分鐘的逼真視頻。Open AI表示,Sora能理解物體在物理世界中如何存在,以及準確地解釋道具并生成引人注目的角色來表達充滿活力的情感。
此前很多大模型已經(jīng)具備了文生圖能力,而Sora則實現(xiàn)了基于理解物理世界基礎(chǔ)上的文生視頻能力。這樣的能力讓很多人為之驚嘆,比如360公司董事長周鴻祎就認為,Sora意味著AGI實現(xiàn)從10年縮短為1年,另外Open AI手里應(yīng)該還藏著一些秘密武器,包括GPT-5,機器自我學習自動產(chǎn)生內(nèi)容等,中美AI差距有可能還在加大。
很多人認為,Sora的出現(xiàn),對于好萊塢電影工業(yè)會產(chǎn)生重大影響,甚至暢想未來拍大片只需要將劇本文字投喂給Sora即可,由此帶來的沖擊是導演、攝像、化妝、道具、剪輯、配音等一大批人的失業(yè)。另外,傳統(tǒng)編劇也將無用武之地,因為劇本文本也可以通過GPT來自動生成。
當然,Open AI也坦誠目前的Sora還存在一些弱點,比如可能難以準確模擬復雜場景的物理原理,并且可能無法理解因果關(guān)系。該模型還可能混淆提示的空間細節(jié),例如混淆左右,并且可能難以精確描述隨著時間推移發(fā)生的事件,例如遵循特定的相機軌跡。不過,隨著大模型訓練的增加和算法的完善,這些問題大概率都會得以解決。
在丁科技網(wǎng)看來,Sora的到來雖然足夠炸裂,但人們對于Sora的破壞力卻有可能低估。
第一,隨著通用大模型的發(fā)展,一段逼真視頻的創(chuàng)作就像手機拍照一樣輕松,由此網(wǎng)絡(luò)上勢必將充斥AI創(chuàng)作的視頻,而這些視頻的真假很難辨別,這無疑會給網(wǎng)絡(luò)安全造成重大沖擊。Sora會成為普通人的視頻創(chuàng)作工具,也會成為騙子們的騙人利器。“眼見為實”這個成語恐怕要下線了。
第二,視頻制作的門檻大為降低,網(wǎng)絡(luò)上勢必會產(chǎn)生大量低俗內(nèi)容,這對青少年的影響將非常大。外界有調(diào)侃認為,低俗內(nèi)容將成為Sora最先落地、最為成功的應(yīng)用場景。當產(chǎn)業(yè)界還在思考與探索如何將Sora應(yīng)用到具體場景時,其很可能已經(jīng)讓低俗內(nèi)容的春天闊步到來。
第三,真實世界和虛擬世界的界限更加模糊,人類的倫理道德、價值觀等不得不進行一次重大重塑。人類的情感通過真實世界來投射,但隨著AI視頻的泛濫,這樣的投射行為將被分解,很大一部分將轉(zhuǎn)移到虛擬世界中。這樣的改變,很難說是好事還是壞事。如何面對真假難辨的虛擬世界,如何在真實世界和虛擬世界來回自如切換,這些都只能摸著石頭過河了。
技術(shù)的浪潮滾滾向前,對于Sora這樣的新科技,我們需要有足夠的敬畏心理,在暢想它給人們生活、工作、娛樂帶來巨大改變的同時,也要留心它對現(xiàn)實社會可能帶來的巨大破壞力。(丁科技網(wǎng)原創(chuàng),轉(zhuǎn)載務(wù)必注明來源:丁科技網(wǎng))
- QQ:61149512