最爱高潮全过程免费的视频_国产无遮挡又黄又爽在线视频_免费人成在线视频_欧美老熟妇乱XXXXX

//kes.net.cn/template/company/tqiye406

Sora火了,通用人工智能要來了?

 2024-03-28 15:50:05

  2024年開年,火通Sora的(de)用人(ren)橫空出世,給AI界投下(xia)一枚重磅炸彈。工智

  這個由美國人工智能公司OpenAI發布的火通文生視頻模型,只需要一段提示文本,用人就能生成具有多個角色和特定動作類型,工智且(qie)主題和背景基本(ben)準確的(de)(de)火通高清視(shi)(shi)頻(pin)。相較(jiao)于Runway Gen 2、用人Pika等AI視(shi)(shi)頻(pin)生(sheng)成應用幾秒鐘連貫性的(de)(de)工(gong)智(zhi)視(shi)(shi)頻(pin)產(chan)出(chu),Sora可生(sheng)成長達60秒的(de)(de)火通連續、穩定、用人高品質視(shi)(shi)頻(pin),工(gong)智(zhi)且(qie)提示文本(ben)越(yue)充分(fen)、火通細節越(yue)精(jing)確,用人生(sheng)成的(de)(de)工(gong)智(zhi)視(shi)(shi)頻(pin)越(yue)真(zhen)實。

  不過,出于可能被濫用的擔憂,OpenAI表示目前并沒有公開發布Sora的計劃。模型有限的(de)訪問權限只被授予小(xiao)部分研究人員(yuan)和(he)創意人士(shi)等群體,以便(bian)OpenAI獲(huo)取(qu)他(ta)們的(de)使用反(fan)饋。

  目前,官網(wang)上已更新了48個Sora生成的(de)演示視(shi)頻。這些視(shi)頻清晰且真實的(de)細節和(he)超高(gao)的(de)精度(du)不禁引發人(ren)們思考:這是否意味著具備人(ren)類同等智能(neng)或超越人(ren)類智能(neng)的(de)通用(yong)人(ren)工智能(neng)(AGI)的(de)到來(lai)?

  對研究AGI意義重大

  Sora問世(shi)后,360集團創始人(ren)周鴻(hong)祎發表了看(kan)法:Sora的(de)(de)出(chu)現讓AGI到來(lai)(lai)的(de)(de)時間提前了。原來(lai)(lai)估計需(xu)要(yao)十來(lai)(lai)年,現在可能只要(yao)兩三年。他認(ren)為,Sora雖然看(kan)起來(lai)(lai)只是個(ge)(ge)文生視頻工具,但實際(ji)上是AI認(ren)知世(shi)界并與之進(jin)行交互的(de)(de)里(li)程(cheng)碑,會給整個(ge)(ge)產業帶(dai)來(lai)(lai)巨(ju)大進(jin)步。

  “實現AGI的技術路線多樣,涉及不同的研究方法和應用方向。”中國科學院自動化研究所副總工程師、紫東太初大模型中心常務副主任王金橋向科技日報記者介紹,目前,學(xue)(xue)術(shu)界(jie)和工業界(jie)廣泛討論(lun)的(de)AGI技(ji)術(shu)路線主要有三條。一是(shi)信息智(zhi)能(neng)(neng),即“大(da)(da)數(shu)據+自(zi)(zi)(zi)監(jian)督(du)學(xue)(xue)習+大(da)(da)算(suan)力”。這(zhe)(zhe)種(zhong)方(fang)法依賴大(da)(da)量(liang)數(shu)據,通(tong)過(guo)自(zi)(zi)(zi)監(jian)督(du)學(xue)(xue)習算(suan)法來訓練模型,同(tong)時需(xu)要巨大(da)(da)的(de)計算(suan)能(neng)(neng)力來處理復雜任務。二是(shi)博弈(yi)智(zhi)能(neng)(neng)。這(zhe)(zhe)種(zhong)技(ji)術(shu)路線強調(diao)在人(ren)機交互中通(tong)過(guo)強化學(xue)(xue)習的(de)方(fang)式訓練智(zhi)能(neng)(neng)體,使其能(neng)(neng)進(jin)行自(zi)(zi)(zi)主學(xue)(xue)習和決策。三是(shi)類腦智(zhi)能(neng)(neng)。這(zhe)(zhe)種(zhong)方(fang)法試(shi)圖通(tong)過(guo)模仿人(ren)腦的(de)運行方(fang)式實現(xian)AGI。

  在(zai)王(wang)金橋看來,根據官(guan)網的演(yan)示視頻,Sora至少在(zai)畫質、長(chang)視頻生(sheng)成、多鏡頭一致(zhi)性、學(xue)習世(shi)界規律、多模態融合等(deng)方面實現(xian)突破。

  “Sora能引發如此轟(hong)動,并不只是(shi)因(yin)(yin)為(wei)(wei)(wei)它(ta)生(sheng)成的(de)視頻時(shi)間更長(chang)、清(qing)晰(xi)度(du)更高,而(er)(er)是(shi)因(yin)(yin)為(wei)(wei)(wei)它(ta)能在一定程度(du)上(shang)模擬物理世界中的(de)物體運動和(he)交(jiao)互(hu)。”王(wang)金(jin)橋說,“這種能力(li)對于AGI的(de)研(yan)究具有重要(yao)意義,因(yin)(yin)為(wei)(wei)(wei)它(ta)涉及機器對現(xian)實世界的(de)深入理解和(he)高度(du)模擬,而(er)(er)這些是(shi)實現(xian)AGI的(de)核心挑戰。”

  記者了解到,為(wei)了準確模(mo)(mo)擬物(wu)理世界(jie)(jie),Sora被投喂了極大規模(mo)(mo)的(de)(de)訓(xun)練數據,并使用(yong)了擴散(san)模(mo)(mo)型(xing)等先進的(de)(de)算法。“對(dui)于(yu)AGI而言,Sora讓大家看到,規模(mo)(mo)效應不只在文字模(mo)(mo)態上成立(li)(li),在視(shi)頻模(mo)(mo)態上也成立(li)(li)。”北京月之暗面科技(ji)有(you)限公司(Moonshot AI)聯合創始人周昕宇認為(wei),“通(tong)過擴展視(shi)頻生成模(mo)(mo)型(xing)可以(yi)建立(li)(li)通(tong)用(yong)物(wu)理世界(jie)(jie)模(mo)(mo)擬器。這是實現AGI的(de)(de)必(bi)要過程。”

  距真正實現AGI仍有距離

  雖然進(jin)步顯著、令人(ren)驚(jing)艷,但Sora仍然存在一些技術缺(que)陷。

  從目前Sora生(sheng)成的(de)視頻(pin)來看,它在(zai)處理某些(xie)細節(jie)時可(ke)能(neng)會出錯,例如混淆物(wu)體的(de)左右(you)方(fang)向(xiang)。同時,它也無法完全理解復雜(za)的(de)因果關系,或在(zai)長(chang)時間跨度內保持故事線的(de)高度一致(zhi)連貫。這些(xie)技(ji)術缺陷導致(zhi)生(sheng)成的(de)視頻(pin)內容可(ke)能(neng)出現與(yu)(yu)邏(luo)輯錯誤,或與(yu)(yu)常識、真實情形不符的(de)情況。

  “Sora模擬(ni)真實物理(li)(li)世界的方式(shi),是通過對(dui)給定的文字、圖像(xiang)、參考視頻進行建(jian)模,然后(hou)預測(ce)想要生成(cheng)的視頻數據的條件概率分布。這與(yu)語言模型(xing)的原理(li)(li)沒(mei)有本質區別,同樣是在(zai)做無(wu)損(sun)壓(ya)縮(suo)。”周昕宇說,“只(zhi)要壓(ya)縮(suo)得足(zu)(zu)夠好,就可(ke)以模擬(ni)出足(zu)(zu)夠真實的物理(li)(li)世界。”

  王(wang)金橋強調,盡管Sora能夠通過學(xue)習了(le)解表層的(de)(de)運動和交互關系,但(dan)是還(huan)沒有學(xue)習到(dao)物(wu)理規律的(de)(de)本質。比如,它不知道多大(da)的(de)(de)風能吹(chui)滅蠟(la)燭,不了(le)解玻璃掉到(dao)地上會碎(sui)、掉到(dao)地毯上不會碎(sui)的(de)(de)本質原因。這也是Sora目前最為人詬(gou)病(bing)之處(chu)。

  “從Sora為數不(bu)多的(de)(de)公(gong)開資料來看,它(ta)仍是數據(ju)驅動下(xia)(xia)的(de)(de)擬合(he),也就是模擬人類(lei)所能看到(dao)的(de)(de)物(wu)理世界。但真實(shi)的(de)(de)物(wu)理世界遠不(bu)僅包含(han)人類(lei)視覺信息。”北京中關村科金(jin)技(ji)術有(you)限公(gong)司(si)技(ji)術副(fu)總(zong)裁張杰認為,Sora的(de)(de)創意來自大數據(ju)量下(xia)(xia)的(de)(de)概率擬合(he),它(ta)并沒(mei)有(you)產生新知識(shi),距離“深度模擬真實(shi)物(wu)理世界”這一目標還(huan)有(you)很長的(de)(de)路(lu)要走。

  中(zhong)國社會科學院哲學研(yan)究(jiu)(jiu)所科技哲學研(yan)究(jiu)(jiu)室主任、研(yan)究(jiu)(jiu)員段偉文(wen)同(tong)樣表(biao)達了(le)審慎(shen)的觀點。“Sora這種近乎人類的表(biao)達實(shi)際上(shang)是一種基于現(xian)有(you)(you)數(shu)據和語料的合成(cheng)智(zhi)能(neng)。”他說,“它給實(shi)現(xian)AGI找(zhao)到了(le)一種可行的路徑,但(dan)距(ju)真正的AGI還有(you)(you)很長的距(ju)離,且對(dui)實(shi)現(xian)AGI的價(jia)值(zhi)相對(dui)有(you)(you)限。”

  事實(shi)上,實(shi)現(xian)AGI這(zhe)一目標可謂道阻且長。王金橋談(tan)到了(le)(le)幾大(da)挑戰。首先是數(shu)(shu)據(ju)瓶頸(jing)。盡管像GPT-4這(zhe)樣的(de)預訓練語言模型(xing)在(zai)(zai)(zai)數(shu)(shu)據(ju)標注上取得了(le)(le)進展,但數(shu)(shu)據(ju)依然是深度學(xue)習中的(de)一個(ge)關鍵限制因素;其次是泛(fan)化瓶頸(jing)。目前的(de)AI系統往往在(zai)(zai)(zai)特定(ding)任(ren)務上表現(xian)出色(se),但在(zai)(zai)(zai)面對新任(ren)務時難以有效適應;最后是能(neng)耗(hao)瓶頸(jing)。隨著AI模型(xing)變得越(yue)來越(yue)復(fu)雜,所(suo)需的(de)計算資(zi)源和能(neng)源消耗(hao)也越(yue)來越(yue)大(da)。這(zhe)對硬件設(she)備提出了(le)(le)更高要(yao)求。

  或將率先落地傳媒領域

  Sora的發(fa)(fa)布不僅推動了(le)技(ji)術的發(fa)(fa)展,也引發(fa)(fa)了(le)對AI治理(li)和倫理(li)的探討(tao)。

  段偉文(wen)提(ti)(ti)到,OpenAI采(cai)取(qu)了相(xiang)關手段來阻(zu)止不當視(shi)(shi)頻的(de)(de)(de)發布。王金橋進(jin)一步解釋道(dao), Sora內(nei)置(zhi)的(de)(de)(de)文(wen)本提(ti)(ti)示(shi)過(guo)濾器可篩選發送(song)給(gei)模型的(de)(de)(de)所有提(ti)(ti)示(shi),阻(zu)止對暴力、色情內(nei)容(rong)、仇(chou)恨言(yan)論以(yi)及名人肖像等(deng)敏感或不適當內(nei)容(rong)的(de)(de)(de)請求。視(shi)(shi)頻內(nei)容(rong)過(guo)濾器能檢查生(sheng)成的(de)(de)(de)視(shi)(shi)頻幀,屏(ping)蔽違反OpenAI安(an)全政策(ce)的(de)(de)(de)內(nei)容(rong)。

  另外(wai),OpenAI團隊(dui)可能(neng)會(hui)定期對Sora進(jin)行優化和更(geng)(geng)新,以改進(jin)其過濾機制,確保(bao)模型能(neng)夠更(geng)(geng)好(hao)地識別和處理敏感(gan)內容(rong)。同時,團隊(dui)可能(neng)會(hui)監控系統的使用情況,以便及時發現并解決(jue)新出現的問題。

  “從(cong)技術上看(kan),Sora避免(mian)極端暴力、色情、名(ming)人肖(xiao)像等內容(rong)出現的方式(shi),主要依(yi)靠的是(shi)模型的對齊(qi)能力。”周昕(xin)宇說,“這(zhe)一點和語言模型的區別不大,也已經(jing)有(you)比較多的實踐經(jing)驗(yan)。”

  據(ju)國際數據(ju)公司(si)預測,Sora將率(lv)(lv)先在短視頻、廣告(gao)、互(hu)動娛(yu)樂、影視制作和媒(mei)體等傳(chuan)媒(mei)領域得到(dao)應用(yong)(yong)。Sora的諸(zhu)多(duo)能力,可以輔(fu)助這些領域的工作者(zhe)更高效(xiao)地進行(xing)(xing)視頻創作,加(jia)快生(sheng)產速度,提高產出數量。這將助力相(xiang)關(guan)行(xing)(xing)業(ye)降低成(cheng)本、提升效(xiao)率(lv)(lv),進一(yi)步優化用(yong)(yong)戶(hu)體驗。(記者(zhe)崔爽)

 

集團總部、集團營銷中心:寶山區友誼路街道1458號
普洱廠部:寶山區張廟街道256號
服務熱線:020-13658441256

微信公眾號

微博

Copyright © 2024 百姓彩票 All Rights Reserved. @TIANHANET 網站地圖