在漫長(zhǎng)的等待之后,Sora,這一由OpenAI精心打造的視頻生成模型,終于在萬(wàn)眾矚目中亮相。北京時(shí)間12月10日凌晨,OpenAI的第三場(chǎng)直播活動(dòng)將Sora正式推向了公眾視野,這款自今年2月預(yù)告以來(lái)便備受期待的產(chǎn)品,此前僅向少數(shù)藝術(shù)家、知名演員及導(dǎo)演提供了試用機(jī)會(huì),而此次的公開(kāi)發(fā)布,瞬間點(diǎn)燃了全球網(wǎng)友的熱情,服務(wù)器一度因訪(fǎng)問(wèn)量過(guò)大而陷入癱瘓。
相較于之前的版本,Sora Turbo在功能上實(shí)現(xiàn)了顯著飛躍。它不僅支持生成最高達(dá)1080p分辨率、時(shí)長(zhǎng)可達(dá)20秒的視頻,更是在視頻編輯領(lǐng)域邁出了重要一步。用戶(hù)現(xiàn)在可以通過(guò)指令實(shí)現(xiàn)視頻的重新混合、剪輯、循環(huán)、混合以及應(yīng)用預(yù)設(shè)風(fēng)格等多種操作,這使得Sora更像是一個(gè)功能強(qiáng)大的視頻編輯器,而非單純的視頻生成工具。
Sora的正式發(fā)布,也引發(fā)了國(guó)內(nèi)AI視頻生成領(lǐng)域的廣泛關(guān)注。眾多國(guó)內(nèi)同行紛紛表示,雖然面臨挑戰(zhàn),但經(jīng)過(guò)近十個(gè)月的追趕,他們已具備了一定的競(jìng)爭(zhēng)力。為了驗(yàn)證這一說(shuō)法,有媒體對(duì)國(guó)內(nèi)外的幾款代表性AI視頻生成工具進(jìn)行了實(shí)測(cè)對(duì)比。
在生成視頻時(shí)長(zhǎng)方面,Sora憑借其20秒的最長(zhǎng)生成時(shí)間占據(jù)領(lǐng)先地位,緊隨其后的是Runway,其單次生成時(shí)間可達(dá)10秒。相比之下,國(guó)內(nèi)產(chǎn)品普遍在5至6秒左右。然而,值得注意的是,雖然白日夢(mèng)宣稱(chēng)最長(zhǎng)可生成6分鐘的視頻,但這并非單次生成的結(jié)果,而是通過(guò)分步生成和編輯實(shí)現(xiàn)的。
在收費(fèi)方面,Sora采取了較為嚴(yán)格的付費(fèi)策略,僅對(duì)ChatGPT的Plus和Pro會(huì)員開(kāi)放使用,且價(jià)格不菲。相比之下,國(guó)內(nèi)產(chǎn)品普遍提供了免費(fèi)體驗(yàn)的機(jī)會(huì),雖然部分功能或使用次數(shù)可能受限。
在功能對(duì)比方面,媒體選取了基礎(chǔ)功能和進(jìn)階功能兩個(gè)維度進(jìn)行測(cè)試?;A(chǔ)功能主要考察各工具對(duì)文字指令的理解度、人物面部清晰度及多人物準(zhǔn)確度。測(cè)試中,Sora在識(shí)別多主體數(shù)量方面出現(xiàn)了一定問(wèn)題,未能準(zhǔn)確識(shí)別出提示詞中的所有主體。而在對(duì)人物面部的特寫(xiě)及復(fù)雜指令的理解方面,各工具均表現(xiàn)出了一定的能力,但存在差異。
進(jìn)階功能測(cè)試則主要聚焦于Sora發(fā)布的新功能。其中,Remix(重混)功能因?qū)崿F(xiàn)復(fù)雜而成為測(cè)試的重點(diǎn)。然而,在實(shí)際操作中,Sora并未能完全展現(xiàn)出樣片中的絲滑效果,出現(xiàn)了胡蘿卜或小狗起飛等異常情況。盡管如此,仍有業(yè)內(nèi)人士認(rèn)為,這可能是由于提示詞、場(chǎng)景或風(fēng)格等因素導(dǎo)致的偶然現(xiàn)象。
綜合來(lái)看,盡管Sora的發(fā)布給國(guó)內(nèi)AI視頻生成領(lǐng)域帶來(lái)了一定的沖擊,但并未達(dá)到讓國(guó)內(nèi)從業(yè)者恐慌的程度。眾多國(guó)內(nèi)產(chǎn)品經(jīng)過(guò)近十個(gè)月的追趕,已在功能上實(shí)現(xiàn)了顯著提升,并在一定程度上具備了與Sora競(jìng)爭(zhēng)的能力。國(guó)內(nèi)產(chǎn)品在收費(fèi)策略上更加靈活,提供了更多免費(fèi)體驗(yàn)的機(jī)會(huì),這也為它們贏得了一定的市場(chǎng)份額。
在對(duì)比過(guò)程中,業(yè)內(nèi)人士也指出了Sora的一些優(yōu)勢(shì)所在。例如,Sora在處理細(xì)節(jié)的連貫性方面表現(xiàn)出色,能夠生成自然流暢的視頻畫(huà)面。同時(shí),Sora還提供了從視頻生成到制作成品的端到端完整產(chǎn)品體驗(yàn),這在國(guó)內(nèi)產(chǎn)品中并不多見(jiàn)。然而,國(guó)內(nèi)產(chǎn)品也在不斷努力提升用戶(hù)體驗(yàn)和產(chǎn)品質(zhì)量,未來(lái)仍有很大的發(fā)展空間。