最爱高潮全过程免费的视频_国产无遮挡又黄又爽在线视频_免费人成在线视频_欧美老熟妇乱XXXXX

//kes.net.cn/template/company/tqiye406

【百姓神彩票】報告揭秘Sora六大優勢 業內:AGI可能在一兩年內實現

 2024-03-29 06:43:24

每(mei)經記者 蘭素英    每(mei)經編輯 孫宇婷    

“兩只金(jin)毛獵犬(quan)在山頂(ding)播(bo)客(ke)”;

“火星上日落時(shi)的報告一場極(ji)具未(wei)來感的無人機比賽(sai)”;

“在一個與自然和諧共生(sheng),同時又(you)有超強朋克氣(qi)質(zhi)和高科(ke)技屬性(xing)的(de)揭秘未來城(cheng)市漫游(you)……”

根據上述提示詞,OpenAI首席執行官阿爾特曼在X平臺上發布了一系列視頻,大優精美的勢業場景讓用戶驚嘆不已。而這些視頻全都是內A內實通過OpenAI 2月16日發布的最新視頻生成模型Sora制作的,用戶震驚之余,兩年百姓神彩票也給予了Sora高度評價,報(bao)告將(jiang)其(qi)描述為“絕無僅有”和“游戲規則改變者”。揭秘

Sora采用了OpenAI文生圖模型DALL·E 3背后的大(da)(da)(da)優(you)強大(da)(da)(da)技(ji)術(shu),可將簡短的勢業文本描述轉化成(cheng)長達1分鐘(zhong)的高清視頻(pin)。業界大(da)(da)(da)佬Gabor Cselle將Sora和(he)Pika、內A內實RunwayML和(he)Stable Video進行對比(bi)后發現(xian),兩年(nian)在(zai)輸入相同的報告提示后,其他主流工具生成(cheng)的揭秘視頻(pin)都大(da)(da)(da)約(yue)只有5秒(miao)鐘(zhong),Sora可以(yi)在(zai)一段長達17秒(miao)視頻(pin)場景中,大(da)(da)(da)優(you)保持動作(zuo)和(he)畫面(mian)一致性。

英偉達人工智能研究院首席研究科學家Jim Fan也對Sora的能力發出感嘆,稱這是視頻生成領域的GPT-3時刻。他表示,Sora是一個“數據驅動的物理引擎”,一個可學習的模擬器或“世界模型”。360集團創始人、董事長周鴻祎則稱,百姓彩票官網登錄隨著(zhu)Sora的(de)到來,人類離(li)AGI真的(de)就(jiu)不遠了,不是10年、20年的(de)問(wen)題,可能(neng)一(yi)兩年很快就(jiu)可以實現。

在隨(sui)后(hou)發布的(de)(de)技術(shu)報告中,OpenAI介紹了(le)Sora的(de)(de)強大性能以及背后(hou)的(de)(de)支撐技術(shu),也對Sora的(de)(de)局限性進行了(le)客觀的(de)(de)分析。《每(mei)日經濟新(xin)聞》記(ji)者(zhe)通(tong)過(guo)梳理,總結(jie)出(chu)了(le)Sora的(de)(de)六大核(he)心優勢。

從技術(shu)上(shang)看(kan),Sora有(you)望將數(shu)字內容的(de)(de)創造(zao)力和(he)真實感提升到新的(de)(de)水平,但(dan)凡事總有(you)兩面(mian)性,影(ying)視、廣告(gao)制作和(he)視頻(pin)(pin)等行業也將面(mian)臨嚴重的(de)(de)沖擊。另外(wai),有(you)專家對于技術(shu)的(de)(de)迅(xun)猛(meng)發(fa)展也表示出(chu)了(le)擔憂(you),稱這類技術(shu)可能會導致“深度偽(wei)造(zao)”視頻(pin)(pin),讓人難以識(shi)別,產生濫用等問題。

報告揭秘Sora六大優勢

值得注意的是,Sora推出的百姓彩票最新網址同一天,谷歌發布了Gemini多模(mo)態(tai)模(mo)型(xing)的更新(xin)版本(ben),而三天前,Stability AI推(tui)出了新(xin)的圖像生成模(mo)型(xing)Stable Cascade。OpenAI的最新(xin)舉動無疑將(jiang)加劇生成式AI圖片和視頻(pin)領(ling)域的競(jing)爭。

而在Sora推出后不久,OpenAI發布了(le)(le)這款新工具的技術報告(gao)(gao)。在報告(gao)(gao)中,OpenAI首先重點介紹了(le)(le)如何將不同類(lei)型的視覺(jue)數據轉(zhuan)化為統一的格式,以(yi)便于(yu)對生(sheng)成(cheng)模型進行(xing)大(da)規模訓練的方(fang)法,并(bing)對Sora的能力(li)和局(ju)限性(xing)進行(xing)了(le)(le)評價。

《每日經濟新聞》記(ji)者對報告進(jin)行梳理(li),總結(jie)出了Sora的六(liu)大優(you)勢:

(1)準(zhun)確(que)(que)性和多(duo)樣(yang)性:Sora可將簡短的(de)文本(ben)描述轉化成(cheng)長達1分(fen)鐘(zhong)的(de)高清(qing)視頻。它(ta)可以準(zhun)確(que)(que)地解(jie)釋用戶提供(gong)的(de)文本(ben)輸入,并生成(cheng)具有各種場(chang)景和人物(wu)(wu)的(de)高質量視頻剪輯。它(ta)涵蓋了廣泛的(de)主題,從人物(wu)(wu)和動(dong)物(wu)(wu)到郁郁蔥蔥的(de)風景、城市場(chang)景、花(hua)園,甚至(zhi)是(shi)水下(xia)的(de)紐約市,可根(gen)據用戶的(de)要求提供(gong)多(duo)樣(yang)化的(de)內容。另(ling)據Medium,Sora能夠準(zhun)確(que)(que)解(jie)釋長達135個單詞的(de)長提示。

(2)強大的(de)語言理(li)解:OpenAI利用(yong)Dall·E模型的(de)recaptioning(重(zhong)述要點(dian))技術(shu),生(sheng)(sheng)成(cheng)(cheng)視(shi)(shi)覺訓練數(shu)據的(de)描述性(xing)字(zi)幕,不僅能提高(gao)文本的(de)準確性(xing),還(huan)能提升視(shi)(shi)頻(pin)的(de)整體質量(liang)。此外,與DALL·E 3類似(si),OpenAI還(huan)利用(yong)GPT技術(shu)將簡短(duan)的(de)用(yong)戶提示轉換為更長的(de)詳(xiang)細轉譯,并將其發送到(dao)視(shi)(shi)頻(pin)模型。這使Sora能夠精(jing)確地按照用(yong)戶提示生(sheng)(sheng)成(cheng)(cheng)高(gao)質量(liang)的(de)視(shi)(shi)頻(pin)。

(3)以(yi)圖(tu)/視頻(pin)(pin)(pin)生成視頻(pin)(pin)(pin):Sora除(chu)了可以(yi)將文本轉化為(wei)視頻(pin)(pin)(pin),還(huan)能(neng)接(jie)受其他類型的輸入提(ti)(ti)示,如已經存在的圖(tu)像(xiang)(xiang)或(huo)視頻(pin)(pin)(pin)。這使Sora能(neng)夠(gou)執行廣泛(fan)的圖(tu)像(xiang)(xiang)和(he)視頻(pin)(pin)(pin)編(bian)輯任務,如創建完美的循(xun)環視頻(pin)(pin)(pin)、將靜態圖(tu)像(xiang)(xiang)轉化為(wei)動畫、向前(qian)或(huo)向后(hou)擴(kuo)展(zhan)視頻(pin)(pin)(pin)等(deng)。OpenAI在報告中(zhong)展(zhan)示了基于(yu)DALL·E 2和(he)DALL·E 3的圖(tu)像(xiang)(xiang)生成的demo視頻(pin)(pin)(pin)。這不(bu)僅證明了Sora的強(qiang)大功能(neng),還(huan)展(zhan)示了它在圖(tu)像(xiang)(xiang)和(he)視頻(pin)(pin)(pin)編(bian)輯領域的無限潛力。 (4)視頻(pin)(pin)(pin)擴(kuo)展(zhan)功能(neng):由(you)于(yu)可接(jie)受多(duo)樣(yang)化的輸入提(ti)(ti)示,用戶可以(yi)根據圖(tu)像(xiang)(xiang)創建視頻(pin)(pin)(pin)或(huo)補充現有視頻(pin)(pin)(pin)。作為(wei)基于(yu)Transformer的擴(kuo)散模型,Sora還(huan)能(neng)沿時(shi)間線向前(qian)或(huo)向后(hou)擴(kuo)展(zhan)視頻(pin)(pin)(pin)。

(5)優異的(de)(de)設備適配性(xing):Sora具備出(chu)色的(de)(de)采樣能力(li),從寬屏(ping)的(de)(de) 1920x1080p 到(dao) 豎 屏(ping) 的(de)(de)1080x1920,兩者(zhe)之(zhi)間的(de)(de)任何視頻(pin)尺寸都能輕松應對。這意味著(zhu)Sora能夠為各種(zhong)設備生(sheng)成與其原(yuan)始縱橫比完美匹配的(de)(de)內容(rong)。而在生(sheng)成高分辨(bian)率內容(rong)之(zhi)前(qian),Sora還能以小尺寸迅速創(chuang)建內容(rong)原(yuan)型。

(6)場(chang)(chang)景(jing)和物體(ti)的(de)(de)(de)一致性和連續性:Sora可(ke)以生成帶有動態視角變(bian)化(hua)的(de)(de)(de)視頻,人物和場(chang)(chang)景(jing)元素在三維空間(jian)中的(de)(de)(de)移(yi)動會顯得更加自然。Sora 能(neng)(neng)夠很好地處理遮擋(dang)問題。現(xian)有模型的(de)(de)(de)一個(ge)問題是,當物體(ti)離(li)開視野(ye)時,它(ta)們(men)可(ke)能(neng)(neng)無法對其進(jin)行(xing)追蹤。而通過一次性提(ti)供多幀預測,Sora可(ke)確(que)保畫面主體(ti)即(ji)使暫(zan)時離(li)開視野(ye)也能(neng)(neng)保持不變(bian)。

Sora讓AGI很快實現?

英(ying)偉達(da)人工智能(neng)研(yan)究(jiu)院(yuan)首席研(yan)究(jiu)科(ke)學(xue)家(jia)Jim Fan在(zai)X平臺發文(wen)表(biao)示,“如果(guo)你還是(shi)(shi)(shi)把(ba)Sora看成DALLE那樣的(de)生成式玩(wan)具,還是(shi)(shi)(shi)好(hao)好(hao)想想吧,這是(shi)(shi)(shi)一(yi)個(ge)數據驅動的(de)物理引擎。他是(shi)(shi)(shi)對許多世界的(de)模(mo)擬,無論(lun)是(shi)(shi)(shi)真實(shi)的(de)還是(shi)(shi)(shi)幻想的(de)。”他認為(wei),Sora是(shi)(shi)(shi)一(yi)個(ge)可學(xue)習的(de)模(mo)擬器,或(huo)“世界模(mo)型”。

在他看來,Sora代表(biao)了文本(ben)生成(cheng)視頻的(de)GPT-3時刻。而(er)針對(dui)部分稱“Sora并沒有學(xue)(xue)習物理,僅(jin)僅(jin)是在二維(wei)空間(jian)里對(dui)像素(su)進行操作”的(de)聲(sheng)音,他表(biao)示,Sora所(suo)展現(xian)的(de)軟物理仿真實際上是一(yi)種(zhong)隨著規模(mo)(mo)擴大而(er)出現(xian)的(de)特性。Sora必須(xu)(xu)學(xue)(xue)習一(yi)些隱式(shi)的(de)文本(ben)到(dao)3D、3D 變換、光(guang)線追蹤渲(xuan)染和物理規則(ze),才(cai)有可能(neng)精確地模(mo)(mo)擬視頻像素(su)。它(ta)必須(xu)(xu)理解游戲引擎的(de)概念(nian),才(cai)有可能(neng)生成(cheng)視頻。

值得一提的是,有(you)網友在(zai)網上評論(lun)Sora生成的60秒時尚女子在(zai)東京(jing)街頭散步時稱,“gg Pixar(皮克斯動畫制(zhi)作公司)”(編注:gg為Good Games縮(suo)寫,代指“打(da)得好,我認輸”),隨(sui)后馬(ma)斯克回(hui)復,“gg humans(人類(lei))”。

對于Sora的(de)(de)(de)最大優勢(shi),360集團(tuan)創始(shi)人、董事長周鴻祎說,“這次OpenAI利用它的(de)(de)(de)大語(yu)言模型優勢(shi),讓Sora實(shi)現了對現實(shi)世(shi)界(jie)的(de)(de)(de)理解(jie)和對世(shi)界(jie)的(de)(de)(de)模擬兩層能(neng)(neng)力,這樣產(chan)生的(de)(de)(de)視頻才(cai)(cai)是(shi)真實(shi)的(de)(de)(de),才(cai)(cai)能(neng)(neng)跳出2D的(de)(de)(de)范圍模擬真實(shi)的(de)(de)(de)物理世(shi)界(jie)。”他同時稱:“一(yi)旦人工(gong)智能(neng)(neng)接上(shang)攝像(xiang)頭,把(ba)所有的(de)(de)(de)電影都(dou)(dou)看一(yi)遍(bian),把(ba)YouTube和TikTok的(de)(de)(de)視頻都(dou)(dou)看一(yi)遍(bian),對世(shi)界(jie)的(de)(de)(de)理解(jie)將遠遠超過文字學(xue)習,一(yi)幅圖(tu)勝過千言萬語(yu),這就離(li)AGI真的(de)(de)(de)就不(bu)遠了,不(bu)是(shi)10年(nian)、20年(nian)的(de)(de)(de)問題(ti),可(ke)能(neng)(neng)一(yi)兩年(nian)很快(kuai)就可(ke)以實(shi)現。”

影視等行業面臨顛覆

然而,Sora在帶來無限可能的同(tong)時,也將對部分行(xing)業產生巨大的影響,包括影視、廣告(gao)制作(zuo)、教(jiao)育、游戲、新聞和動畫等領(ling)域。

談及Sora的行業(ye)沖擊時(shi),Jim Fan評價道(dao),Sora的物(wu)(wu)理(li)學理(li)解(jie)目前(qian)還(huan)是脆弱的,遠非完美。它(ta)仍(reng)然會產(chan)生幻覺,生成(cheng)與物(wu)(wu)理(li)常識不符的事物(wu)(wu),還(huan)沒有很好(hao)地(di)掌握物(wu)(wu)體交互的原(yuan)理(li)。

周鴻祎對(dui)此(ci)也深以(yi)為(wei)然,他指出(chu),AI不一(yi)定(ding)那么快顛覆所有行業(ye),但它能激發(fa)更多(duo)人的(de)創作力。他表示,“Sora只是(shi)小試牛刀,它展現的(de)不僅僅是(shi)一(yi)個視頻制(zhi)作的(de)能力,而(er)是(shi)大模型對(dui)真實世界有了理解和模擬之后,會(hui)帶來新的(de)成果和突(tu)破。”

他(ta)解釋說,“機器能(neng)生(sheng)產(chan)一個好視頻,但視頻的主題、腳本和分鏡頭策劃、臺詞的配(pei)合,都(dou)需要(yao)人的創(chuang)意(yi)至少需要(yao)人給提示詞。”他(ta)強(qiang)調,科技競(jing)爭最終比(bi)拼的是人才(cai)密度和深厚積累(lei)。

而(er)對于Sora存在(zai)的(de)(de)弱點,OpenAI也明(ming)確(que)指出,它可(ke)能難(nan)以準確(que)模擬復(fu)雜場景(jing)的(de)(de)物理(li)原理(li),并且(qie)可(ke)能無(wu)法理(li)解因果關系。該模型還(huan)可(ke)能混(hun)淆提示的(de)(de)空(kong)(kong)間細節,例如(ru)(ru)混(hun)淆左右,并且(qie)可(ke)能難(nan)以精確(que)描述隨著時間推移發(fa)生的(de)(de)事件,如(ru)(ru)遵循特(te)定的(de)(de)相機(ji)(ji)軌(gui)跡。而(er)這些(xie)(xie)缺陷可(ke)能導致(zhi)Sora生成一些(xie)(xie)不合邏輯的(de)(de)東西,比如(ru)(ru)一個人在(zai)跑(pao)步機(ji)(ji)上跑(pao)錯(cuo)方向,以不自然的(de)(de)方式改變主(zhu)題(ti),甚至出現憑空(kong)(kong)消失現象。

濫用仍是最大的擔憂

隨著名人(ren)等人(ren)物的深度(du)造假(jia)視頻在(zai)網上變得越(yue)(yue)來越(yue)(yue)普遍,相應的倫(lun)理和安(an)全問題也讓人(ren)心驚。

Gartner 分(fen)(fen) 析 師 Arun Chandrasekaran表(biao)示,“鑒于這(zhe)項技(ji)(ji)術(shu)確(que)實非常新,他們必須對其進行充(chong)分(fen)(fen)控(kong)制,以防止其被(bei)濫用和誤用,甚至(zhi)客(ke)戶(hu)在(zai)沒(mei)有認(ren)識(shi)到(dao)這(zhe)項新興(xing)技(ji)(ji)術(shu)所有局限(xian)性的情況(kuang)下使用它。”他補充(chong)道,OpenAI為該模型設置的防護措(cuo)施(shi)以及確(que)定誰(shui)可以獲得訪問權(quan)限(xian)至(zhi)關重(zhong)要(yao)。

牛(niu)津(jin)互聯網學院客座政策研究員Mutale Nkonde也表示,任何人都可以輕松地將文本(ben)轉換(huan)為視(shi)頻(pin)這一想法令(ling)人興奮。但同時,她(ta)也擔心這些工具可能會(hui)植入社會(hui)偏(pian)見等內容,對人們生計造成影響等。

普(pu)林(lin)斯頓大學(xue)計算機科(ke)學(xue)教(jiao)授Arvind Narayanan對此也(ye)有擔憂(you),認為Sora這類(lei)技術可能會(hui)(hui)導(dao)致“深(shen)度偽造”視頻,讓人(ren)們難(nan)以識別。雖然(ran)AI制(zhi)作的視頻仍會(hui)(hui)有一(yi)些(xie)不(bu)一(yi)致的地方,但普(pu)通(tong)人(ren)可能不(bu)會(hui)(hui)注意到這些(xie)細節。“遲早,我們需要(yao)適應現實主義不(bu)再是真實性的標志這一(yi)事實。”

 

集團總部、集團營銷中心:寶山區張廟街道256號
普洱廠部:金山區石化街道115號
服務熱線:020-13562154844

微信公眾號

微博

Copyright © 2024 百姓彩票 All Rights Reserved. @TIANHANET 網站地圖