您現在的位置是:時(shí)尚 >>正文
記者實(shí)測Sora2,AI視頻的GPT
時(shí)尚4276人已圍觀(guān)
簡(jiǎn)介第一財經(jīng)記者實(shí)測Sora2發(fā)現,相比去年發(fā)布的初代Sora,Sora2在物理邏輯、畫(huà)面一致性、真實(shí)感上都有顯著(zhù)提升,一張照片加一句提示詞,AI就能創(chuàng )作出有劇情、有文案的短片。但“現實(shí)不存在了”嗎?從測 ...

第一財經(jīng)記者實(shí)測Sora2發(fā)現,實(shí)測視頻相比去年發(fā)布的實(shí)測視頻初代Sora,Sora2在物理邏輯、實(shí)測視頻畫(huà)面一致性、實(shí)測視頻真實(shí)感上都有顯著(zhù)提升,實(shí)測視頻一張照片加一句提示詞,實(shí)測視頻AI就能創(chuàng )作出有劇情、實(shí)測視頻有文案的實(shí)測視頻短片。
但“現實(shí)不存在了”嗎?實(shí)測視頻從測試來(lái)看,Sora2尚未完全跨越“真實(shí)”這道門(mén)檻。實(shí)測視頻
至頂科技總編輯、實(shí)測視頻PEC聯(lián)合發(fā)起人高飛對記者表示,實(shí)測視頻Sora2比起上一代Sora是實(shí)測視頻一個(gè)大版本更新,在很多場(chǎng)景都達到了以假亂真的實(shí)測視頻程度,不過(guò),實(shí)測視頻相比其他AI產(chǎn)品Sora2的技術(shù)并沒(méi)有代差領(lǐng)先,更值得關(guān)注的是其產(chǎn)品玩法,在打造互聯(lián)網(wǎng)產(chǎn)品方面,他認為OpenAI暫時(shí)領(lǐng)先于其他公司。
OpenAI在官方博客中宣稱(chēng),Sora2是“邁向GPT-3.5時(shí)刻的一步”。但AIGC創(chuàng )作領(lǐng)域的KOL@尾鰭Vicky認為,對于創(chuàng )作者來(lái)說(shuō),可能這一時(shí)刻還沒(méi)到來(lái),畢竟產(chǎn)品還是無(wú)法徹底解決一致性和物理問(wèn)題。但對于大多數普通受眾來(lái)說(shuō),玩AI視頻可能真的變成了一件很接近、且很有趣的事情。
實(shí)測Sora 2:優(yōu)缺點(diǎn)同樣突出
毫無(wú)疑問(wèn),過(guò)去兩天,OpenAI做了一場(chǎng)成功的產(chǎn)品發(fā)布營(yíng)銷(xiāo),截至發(fā)稿,在美區iOS的免費應用排行榜上,Sora APP已經(jīng)空降第三位,僅次于谷歌的Gemini和OpenAI自家的ChatGPT。
由于Sora采用邀請制免費使用,在國內,閑魚(yú)上已經(jīng)出現29.9元買(mǎi)邀請碼的生意,不過(guò)單價(jià)6.88元的邀請碼更受歡迎,界面顯示已經(jīng)有近50人想要。

用戶(hù)在使用Sora2之前都需要準備一個(gè)邀請碼,邀請碼注冊后,可以再裂變出4個(gè)邀請碼,再分享給朋友。而邀請碼一旦被使用,就會(huì )自動(dòng)關(guān)注邀請對象,由此逐漸形成好友網(wǎng)絡(luò )。從這點(diǎn)來(lái)看,Sora從一開(kāi)始就植入了強社交基因。
有人將Sora稱(chēng)之為“AI版抖音”,應用主頁(yè)是垂直視頻流,用戶(hù)可以上下滑動(dòng)瀏覽不同用戶(hù)發(fā)布的視頻,但應用上所有的內容都是AI生成的。在生成視頻時(shí),用戶(hù)可以選擇上傳圖片并結合文字提示,也可以用“Cameo”(客串)功能,基于自己或朋友形象進(jìn)行提示詞生成。
Sora2是Sora APP的技術(shù)底座,OpenAI在博客中表示,Sora2可以完成之前的視頻生成模型難以完成的事情。它比之前的系統在物理上更加精準、逼真,并且在可控性方面有了巨大的飛躍,此外,它還配備了同步音頻。
在拿到邀請碼后,第一財經(jīng)記者測試了基于Sora視頻生成的效果,確實(shí)相比初代有了大幅提升,其輸出的結果已經(jīng)基本能滿(mǎn)足C端用戶(hù)娛樂(lè )的需求,較為亮眼的地方在于,AI在鏡頭語(yǔ)言上很豐富,對話(huà)有想象力,音頻輸出方面口型與發(fā)音一致。但目前一個(gè)10s的視頻需等待數分鐘才能生成,速度并不快,且分辨率不高。
以?shī)W爾特曼為主角,記者給AI的提示詞是:@sama在工作敲代碼,一只銀漸層走過(guò)來(lái)生氣地關(guān)掉了電腦主機電源,他們開(kāi)始吵架。

在這個(gè)視頻中,Sora精準特寫(xiě)了貓爪關(guān)電源的畫(huà)面,伴隨準確的關(guān)機音效,也展現了奧爾特曼吵架時(shí)生氣的表情和姿態(tài),細節和環(huán)境都很真實(shí)。在發(fā)音時(shí),人物的口型也能對得上。
值得一提的是,Sora還會(huì )補充給角色“加戲”,在提示詞中記者只提到了“開(kāi)始吵架”,但AI視頻對話(huà)中,貓咪會(huì )抱怨“你一下午都沒(méi)陪我,而且風(fēng)扇像拖拉機一樣”,主角則回復“先開(kāi)回來(lái),咱倆再談”。 情節補充自然,配合場(chǎng)景非常真實(shí)。
但這一產(chǎn)品也并非毫無(wú)瑕疵,例如,錄入人臉輸出的視頻并不完全像本人,有用戶(hù)反饋是“似像非像”的效果,同時(shí),Sora在事實(shí)邏輯上仍有錯誤,在一個(gè)用滅火器的場(chǎng)景中,滅火器噴霧的出口并不準確。

中文支持更是“重災區”。例如,有用戶(hù)讓奧爾特曼成為外賣(mài)員,其外賣(mài)服上出現了憑空生造的文字。

@尾鰭Vicky認為,Sora優(yōu)點(diǎn)很明顯,用戶(hù)數字人的物理效果和唇型驅動(dòng)效果很好,且在A(yíng)PP的使用交互上下了一些功夫,例如從注冊就讓用戶(hù)在“驗證”的過(guò)程中完成素材內容的錄制,且是很短的音頻和視頻,就能輸出不錯的效果。此前這樣圖生、文生視頻路徑已經(jīng)出來(lái)很久,但效果應用都沒(méi)有Sora這么自然、對用戶(hù)如此友好。
但另一方面,Sora缺點(diǎn)同樣突出。@尾鰭Vicky提到,雖然相比初代Sora2的物理理解問(wèn)題已經(jīng)更好了,但涉及到多元素的物體交互時(shí),還是會(huì )出現手腳和臉糊等丟失細節,動(dòng)作不符合物理邏輯等問(wèn)題。從這個(gè)維度上來(lái)說(shuō),Sora2在模型能力的提升上并沒(méi)有邁到可以真正解決技術(shù)問(wèn)題的那一步。
GPT-3.5時(shí)刻到了嗎
在官方博客中,OpenAI將2024年2月的初代 Sora比作“視頻的GPT-1時(shí)刻”,而 Sora2則被定義為“可能直接跳到了GPT-3.5的時(shí)刻”。
博客中解釋認為,之前的視頻模型會(huì )變形物體和變形現實(shí),但Sora 2可以做一些對于之前的視頻生成模型來(lái)說(shuō)非常困難的事情,如奧林匹克體操動(dòng)作,在槳板上的后空翻,精確地模擬浮力和剛性的動(dòng)態(tài)。模型在可控性方面也有了很大的飛躍,能夠創(chuàng )建復雜的背景音、語(yǔ)音和具有高度真實(shí)感的聲音效果。
但問(wèn)題是,AI視頻的“GPT-3.5時(shí)刻”真的來(lái)了嗎?@尾鰭Vicky認為,至少對于創(chuàng )作者來(lái)說(shuō)還沒(méi)有,因為Sora 2還是無(wú)法徹底解決一致性和物理問(wèn)題。但對普通用戶(hù)來(lái)說(shuō),AI視頻的門(mén)檻已大幅降低,用戶(hù)玩AI視頻真的變成了一件很簡(jiǎn)單且很有趣的事。
高飛認為,Sora2相比其他AI產(chǎn)品Sora2的技術(shù)并沒(méi)有代差領(lǐng)先,例如谷歌有Veo3,也有Nano banana以及世界模型Genie3,在多模態(tài)方面相當強悍。而國內的可靈、即夢(mèng)也能與之一戰。
今年5月,Veo3推出時(shí)也曾在社交網(wǎng)絡(luò )火出圈,一些人物視頻極具真實(shí)感,被認為是AI視頻領(lǐng)域領(lǐng)先的水準。但彼時(shí)行業(yè)人士仍然認為,現階段的AI視頻對實(shí)際生產(chǎn)幫助仍然不算太大,并未來(lái)到真正的GPT時(shí)刻。
相較于模型技術(shù),高飛認為Sora2更值得關(guān)注的是產(chǎn)品玩法。OpenAI將它打造成了一個(gè)更類(lèi)似于短視頻的消費者App,其主要機制是要求用戶(hù)上傳自己的臉部數據和聲音信息做AI二創(chuàng )?!斑@樣一方面很容易拿到了最為寶貴的消費者面部數據,其次用戶(hù)基于自己的人臉創(chuàng )造的視頻,配合邀請碼機制,也很容易吸引親朋好友鏈式傳播?!?/p>
因此,高飛的觀(guān)察是,“OpenAI可能在模型不一定是最強,但是在打造互聯(lián)網(wǎng)產(chǎn)品方面,領(lǐng)先于其他所有公司?!边@次Sora2不追求畫(huà)質(zhì)和時(shí)長(cháng),也是典型的互聯(lián)網(wǎng)打法,先完成再完美,后續再迭代。
@尾鰭Vicky也認為,Sora2這次的發(fā)布更側重APP的交互設計,并不僅是模型本身的更新?!癝ora2目前的定位,似乎并不是以專(zhuān)業(yè)的AI視頻創(chuàng )作為導向,而是更專(zhuān)注于如何用AI視頻來(lái)完成用戶(hù)社交,做尋找應用場(chǎng)景的新嘗試?!?/p>
從海外市場(chǎng)來(lái)看,對于Sora2和Sora應用的發(fā)布則褒貶不一。有用戶(hù)認為技術(shù)驚艷、創(chuàng )造力會(huì )大爆發(fā),也有人認為這些無(wú)聊的視頻毫無(wú)意義,與宏大的AGI愿景、人類(lèi)福祉相悖。
有用戶(hù)發(fā)帖諷刺稱(chēng),2周前,奧爾特曼說(shuō)“我們需要 7 萬(wàn)億美元和 10 吉瓦來(lái)治愈癌癥”,他現在表示“我們正在推出以個(gè)性化廣告形式營(yíng)銷(xiāo)的 AI垃圾視頻”。
奧爾特曼轉發(fā)了這一帖子,并回復稱(chēng)需要資金來(lái)繼續研究AI,并且幾乎所有的研究精力仍然集中在通用人工智能上。 “向人們展示很酷的新技術(shù)或者產(chǎn)品,讓他們開(kāi)心,并借此來(lái)賺取一些錢(qián),這也是一件好事?!眾W爾特曼稱(chēng),當談到公司的最佳發(fā)展軌跡時(shí),現實(shí)情況是微妙的。
“重要的是讓人類(lèi)從這些模型的開(kāi)發(fā)中受益。我們認為Sora會(huì )給世界帶來(lái)很多歡樂(lè )、創(chuàng )造力和聯(lián)系?!監penAI在博客中寫(xiě)道。未來(lái),隨著(zhù)視頻模型持續進(jìn)化,通用世界模擬器與機器人Agent將重塑社會(huì ),無(wú)論如何,Sora 2朝這一目標邁出了重要的一步。
Tags:
轉載:歡迎各位朋友分享到網(wǎng)絡(luò ),但轉載請說(shuō)明文章出處“素昧平生網(wǎng)”。http://www.jnyxfs.com/html/65c16499770.html
相關(guān)文章
貴州茅臺:選舉陳華為董事長(cháng)
時(shí)尚來(lái)源:財聯(lián)社財聯(lián)社11月28日電,貴州茅臺600519.SH)公告稱(chēng),選舉陳華為公司第四屆董事會(huì )董事長(cháng),并調整董事會(huì )專(zhuān)門(mén)委員會(huì )成員。同時(shí),公司決定投資不超過(guò)1.22億元用于實(shí)施茅臺廠(chǎng)區10kV高壓雙電 ...
【時(shí)尚】
閱讀更多新能源乘用車(chē)又降價(jià)了!六年來(lái)均價(jià)首次跌破16萬(wàn)元,純電動(dòng)車(chē)降得最狠
時(shí)尚每經(jīng)記者|段思瑤每經(jīng)編輯|余婷婷“智己L6近期新增了無(wú)門(mén)檻現金立減3000元,同時(shí)還有5000元預付款兌換價(jià)值1.7萬(wàn)元現金抵扣券?!?0月21日,某智己經(jīng)銷(xiāo)商告訴《每日經(jīng)濟新聞》記者,除了現金優(yōu)惠之 ...
【時(shí)尚】
閱讀更多上海奉賢富力萬(wàn)達廣場(chǎng)將被拍賣(mài),起拍價(jià)約12.23億元
時(shí)尚根據司法拍賣(mài)公告的內容顯示,奉賢富力萬(wàn)達廣場(chǎng)的各大樓棟土建工程已完工,但外立面、室內裝修、配套設施等仍未完成。具體來(lái)看,1號樓總高22層,1-6層為商場(chǎng),7-22層為辦公區域。目前,商場(chǎng)部分外立面局部 ...
【時(shí)尚】
閱讀更多
熱門(mén)文章
最新文章
友情鏈接
- 賽季無(wú)冠或離任!阿爾特塔執教遭質(zhì)疑,津琴科或另尋出路
- (成都世運會(huì ))時(shí)隔十二年重返世運:郭丹用堅持詮釋熱愛(ài)
- (成都世運會(huì ))時(shí)隔十二年重返世運:郭丹用堅持詮釋熱愛(ài)
- 舍瓦利耶接棒:巴黎圣日耳曼為何放棄多納魯馬?
- 費迪南德預測:利物浦將重返英超巔峰,哈蘭德鎖定金靴
- 中國男籃官宣:曾凡博恢復未達標無(wú)緣亞洲杯張鎮麟也缺席拉警報
- ESPN評選歐洲十大主帥,恩里克奪冠,孔蒂入榜
- 臺州學(xué)子全國賽場(chǎng)奪金,見(jiàn)證青春拼搏的力量!
- 記者:從賽程來(lái)看征戰亞冠二級聯(lián)賽對國安影響不大,簽位不錯
- 2025年福建省青少年田徑冠軍賽圓滿(mǎn)落幕,精英選手閃耀賽場(chǎng)