最爱高潮全过程免费的视频_国产无遮挡又黄又爽在线视频_免费人成在线视频_欧美老熟妇乱XXXXX

//kes.net.cn/template/company/tqiye406

中文版 Sora,難倒互聯網大廠

 2024-03-28 10:47:01

圖片來(lai)源 @視覺(jue)中國

文|智能 Pro

科技圈(quan)當下最火話題,中(zhong)(zhong)文(wen)非 Sora 莫屬。倒互大廠Sora 的(de)聯(lian)網影響力也(ye)早已(yi)沖出硅(gui)谷、輻(fu)射全球,中(zhong)(zhong)文(wen)在大洋彼岸(an)的(de)倒互大廠中(zhong)(zhong)國掀起滔天巨浪。

在二級市場,聯網Sora 概念股(gu)(gu)(gu)連日(ri)走高,中文勢頭比起(qi)當初的倒互大(da)(da)廠 ChatGPT 概念股(gu)(gu)(gu)有(you)過之(zhi)而無不及,比如 2 月 20 日(ri),聯(lian)網A 股(gu)(gu)(gu)、中文港股(gu)(gu)(gu) Sora 概念股(gu)(gu)(gu)板(ban)塊就有(you)超過 60 只個股(gu)(gu)(gu)飄紅,倒互大(da)(da)廠其中 5 家(jia)企業股(gu)(gu)(gu)價暴漲(zhang) 40% 以上(shang)。聯(lian)網

在科技互聯網圈,中文爭奪中文版 Sora 首發權,倒互大廠成為巨頭的聯網新目標。不過和當初的中文版 ChatGPT 首發爭奪戰相比,中文版 Sora 的研發難度也更大,大廠們大多面露難色。此前被盛(sheng)傳將(jiang)推出(chu)首個中(zhong)文版 Sora 的(de)(de)字節跳(tiao)動,就在 20 日辟(pi)謠(yao),稱相關產品的(de)(de)效果距(ju)離(li) Sora 還有(you)很大差距(ju)。

在 Sora 橫(heng)空(kong)出世前,國內 " 千(qian)(qian)模大(da)戰 " 早已陷入膠著狀(zhuang)態(tai),未(wei)曾想,風口突變,從圖文生成(cheng)轉向視(shi)頻生成(cheng)," 千(qian)(qian)模大(da)戰 " 也將進(jin)入全(quan)新階段(duan)。

在上一階段稍稍落后的字節跳動在視頻業務上有先天優勢,自然不會錯過這個彎道超車的機會,這不僅事關大廠的面子,更是為了捍衛其核心業務——抖音 CEO 張楠突然辭職專攻剪映,也被視作是字節重視 AIGC 的動作。

雖然沒有中文版 Sora但字節一直在死磕 AI

在(zai)文本生成式大模型領域,字節的起步時間無疑是比百(bai)度、阿里巴巴等大廠要晚,這也讓(rang)字節的高層十(shi)分懊惱。CEO 梁汝波就(jiu)在(zai)內部講話中直言,很難相信技術團隊直到 2023 年(nian)才討論 GPT,要知道業內做得比較好的大模型企業都是在(zai) 2018-2021 年(nian)起步的。

好在,知恥而(er)后勇,還有亡羊補牢的機(ji)會(hui)。

一開始,字節希望以量取勝,在去年下半年扎堆上線了十多款 AI 產品。

這當中(zhong),既有(you)大廠(chang)標配的(de)基礎大模型 " 云雀 ",也有(you)在(zai) C 端最流行的(de) AI 對話(hua)類應用,如(ru) " 豆(dou)包 "、" 話(hua)爐 " 和(he) " 抖音(yin)小晴 ",還有(you)輔助創作(zuo)的(de) AI 工具,如(ru)劇(ju)情(qing)創作(zuo)平(ping)臺(tai) "BagelBell"、電商(shang)內容創作(zuo)應用 " 即創 " 等(deng)。由字節技術副總裁(cai)洪定坤率領(ling)的(de)新部(bu)門 Flow,則在(zai)背后為這一系列 AI 產品保駕護航。

(圖片來(lai)自豆包官網(wang))

據悉,字節還在內部開放了大量活水崗位,希望調集全公司最優秀的技術、產品人才集中精力搞 AI。除了前面提到的洪定坤外,原飛書產品副總裁齊俊元、抖(dou)音(yin)社交負(fu)責人陸游、字節(jie)跳動產品與戰略副總裁朱駿等(deng)高管也(ye)先后(hou)馳援。甚至在(zai)國外,字節(jie)跳動也(ye)組(zu)織了 50 多人的(de)研發團(tuan)隊,負(fu)責推進 "Cici" 項目。

然而,字節在文本生成大模型這條賽道確實是落后了,即便后期不斷加大投入,恐怕也很難抹平差距。明白這個道理后,再結合自身的業務狀況,字節開始發力圖像、視頻生成領域,試圖確立差異化優勢。而在春節前后,內部的一系列人事變動、團隊重組,則是其為視頻生成大模型奮力一搏的最佳證明。

2 月 9 日,張(zhang)楠宣(xuan)布(bu)辭去(qu)抖音集團 CEO 一職,原(yuan)因是(shi)(shi)要(yao)把精力(li)集中(zhong)到剪映的(de)發(fa)展上(shang)。眾(zhong)所周(zhou)知,張(zhang)楠是(shi)(shi)字(zi)節(jie)內(nei)部最有權(quan)勢的(de)高管(guan)之一,很多人將(jiang)其視為僅(jin)次于集團 CEO 梁汝波的(de)二把手。其掌管(guan)的(de)抖音集團,則(ze)是(shi)(shi)字(zi)節(jie)最重要(yao)的(de)業務,此(ci)次自降身份掌管(guan)剪映,在內(nei)部、外界都引發(fa)了不少爭議。

如今再看,作為一款視頻剪輯及輔助(zhu)創作工具,剪映是(shi)字(zi)節業(ye)務版圖(tu)里和視頻生成大(da)模型契合(he)度最(zui)高(gao)的一環,是(shi)承載 AI 視頻創作業(ye)務的最(zui)佳(jia)抓手。像(xiang)張楠這種級別的核心高(gao)管主動接管剪映,恰好說明字(zi)節對該(gai)項(xiang)目(mu)的重視。

有消息指(zhi)出,張楠去年已經把大(da)部分精力(li)花在(zai)剪映(ying)身上,抖音(yin)的各(ge)項業務分別交給(gei)韓尚佑(you)(抖音(yin)集團新任 CEO)、魏(wei)雯(wen)雯(wen)(抖音(yin)電商總裁)、蒲燕(yan)子(抖音(yin)本(ben)地(di)生活負責人)等高(gao)管接手。

去(qu)年 11 月,剪映就(jiu)悄(qiao)悄(qiao)內測(ce)了一項(xiang)名(ming)為 "Dreamina" 的 AI 輔助工具,用戶只(zhi)需要輸入文字(zi)(zi),即可生成創意圖像(xiang)。算上(shang)(shang)研(yan)(yan)發(fa)周期,該項(xiang)目(mu)的立項(xiang)至少在去(qu)年二季(ji)度前。如果上(shang)(shang)述消息屬實,張楠(nan)帶領(ling)的團隊應(ying)該在更早(zao)的時候就(jiu)接手了字(zi)(zi)節的 AI 產品研(yan)(yan)發(fa)工作(zuo)。

張楠正式官宣辭任集團 CEO 之后,也有消息稱其帶領的團隊將推出一個全新的 AI 視頻生成軟件。如今,這款備受期待的產品—— "Boximator",終于浮出水面,這也是字節沖擊中文版 Sora 的王牌。

Sora 攪動一池春水大模型改造短視頻行業

據(ju)悉,字節內部對 "Boximator" 的(de)定(ding)位為(wei)創新性視(shi)頻(pin)生成大模(mo)型(xing),將(jiang)通過控(kong)制對象運動的(de)方(fang)式,精確(que)控(kong)制視(shi)頻(pin)人物、物體的(de)運動。該模(mo)型(xing)采(cai)集的(de)訓練(lian)(lian)數(shu)據(ju)來自(zi) webVid-10M 數(shu)據(ju)集,并(bing)在 PixelDance 和 ModelScope 兩個(ge)視(shi)頻(pin)生成模(mo)型(xing)中進行訓練(lian)(lian)。

然而,正如字節日前的回應那般,視頻(pin)生(sheng)成大模(mo)型(xing)的研發(fa)難度比想象(xiang)中更(geng)大。根(gen)據字節方面的說法,"Boximator" 保真(zhen)率(lv)、畫面質量、視頻(pin)時(shi)長(chang)等(deng)方面距離 Sora 還有(you)很大差(cha)距,暫時(shi)不具備(bei)落地的條件,預計還要 2-3 個月才能開(kai)放測試。

但 2-3 個月,可以發生很多事情——Sora 可能已經迭代到更先進的版本,和尚未落地的競品拉開更大差距;其他競爭對手也可能迎頭趕上,搶在字節之前推出同類產品。

對于這些可能性,字節跳動心里肯定有數,而且比誰都著急。原因很簡單:比起文本生成大模型,視頻生成大模型和字節跳動的短視頻、直播等核心業務關聯更緊密,影響也更大。

如果說搜索是第一個被 ChatGPT 顛覆的行業,那么長 / 短視頻肯定是最有可能被 Sora 顛覆的行業。正如當初谷歌、百度、360 等巨頭傾力投入文本生成大模型研發那樣,字節在視頻生成大模型這一戰中也不容有失。因為隨著視頻生成大模型在日后逐漸普及,短視頻內容生產、營銷、變現等一系列邏輯都可能發生變化。

以內容(rong)生產為例,制(zhi)作方對真人演員、編劇(ju)、剪輯人員的(de)(de)需求很有可能會減少(shao),傳統的(de)(de)制(zhi)作流程也會被大幅簡化、制(zhi)作時長(chang)將(jiang)被壓(ya)縮(suo)。這帶來的(de)(de)直(zhi)接(jie)后(hou)果,不(bu)止是生產內容(rong)數量呈幾何級增長(chang)、成本明顯減少(shao),也必(bi)將(jiang)導致更殘酷的(de)(de)競爭(zheng),加速(su)優勝劣汰。

在 Sora 走(zou)紅之后,有關剪(jian)映(ying)會(hui)不會(hui)被取代的(de)問題已經迅速成為焦點話(hua)題。留給剪(jian)映(ying)的(de)路只(zhi)要一條(tiao),那就是(shi)主動(dong)擁抱 AI,向 Sora 看齊。要是(shi)能成功抱上 AI 這條(tiao)大(da)腿(tui),剪(jian)映(ying)的(de)用戶體量(liang)可(ke)以再上一個(ge)臺階,商(shang)業化潛力也(ye)將大(da)大(da)提升。

舉個最(zui)簡單的例子(zi),現(xian)在(zai)的剪映只(zhi)提(ti)供基礎服務,收費模(mo)式很難推廣。但(dan)如果能(neng)像 Sora 那樣,提(ti)高(gao)內容創作者(zhe)的效率、降低成本(ben),收費也就更有底氣。Stability AI、Runway 等獨角(jiao)獸的估值大幅(fu)飆升(sheng),就證(zheng)明了這條路線的可行性。

當然,因 Sora 而焦慮的大廠絕不止字節跳動一家。短視頻行業的另一個巨頭快手,還有愛奇藝、騰訊視頻、優酷、嗶哩嗶哩為首的流媒體平臺,也必須啃下視頻生成大模型這塊硬骨頭。

可(ke)能(neng)是 Sora 的沖擊太大(da),還需要時間消化,也(ye)可(ke)能(neng)是吸取之(zhi)前的教(jiao)訓,先埋頭干實事不著急到臺(tai)前造勢,上述大(da)廠(chang)大(da)多尚未表態是否及何時推出(chu)類 Sora 應用。截止發稿時,只有(you)芒(mang)果超(chao)媒表態將探(tan)索文(wen)生(sheng)視頻等 AI 技術在傳媒領域的落地(di)。但明眼人(ren)都看得出(chu),這些大(da)廠(chang)沒有(you)一個會(hui)缺(que)席(xi)這場(chang)全(quan)新的 " 千(qian)模大(da)戰 "。

有危機感,就會有動力。大廠們集體(ti)沖刺,到(dao)底誰能(neng)率先撞線(xian)?

沖刺中文版 Sora

哪家中國大廠先撞線?

要猜(cai)測(ce)誰能率(lv)先(xian)研發出中文版 Sora,或者說類(lei)(lei) Sora 視頻(pin)生成大模型,得先(xian)看一下這類(lei)(lei)產(chan)品的研發難點。

從 openAI 公布的(de)(de)報告(gao)來看,Sora 并沒有(you)應用什么全(quan)新研發成(cheng)果,核心技(ji)術都是早已公開(kai)的(de)(de)。這當中(zhong),視頻(pin)壓縮網絡(luo)、擴散模型(xing)、視覺補丁(類(lei)似于本文生成(cheng)大模型(xing)的(de)(de)文本標記(ji))、圖像及視頻(pin)編輯(ji)是最關(guan)鍵(jian)的(de)(de)幾個(ge)環節(jie)。本質上講,Sora 仍是一個(ge)基于 Transformer 架構的(de)(de)擴散模型(xing),和 ChatGPT 有(you)很多相似之處(chu)。

當中的技術原理和繁瑣的訓練流程,這里不再一一展開。可以確定的是,大廠們都具備開發中文版 Sora 的基礎,起跑線不會有太大差距。除了考驗財力之外,和之前的中文版 ChatGPT 之爭一樣,數據樣本、算力、測試條件,將很大程度上左右最終賽果。

這當(dang)中,數據樣本關系著大(da)模(mo)型的效(xiao)果(guo)(guo),訓練數據越(yue)(yue)豐(feng)富、越(yue)(yue)完整(zheng),視(shi)頻(pin)大(da)模(mo)型就(jiu)能越(yue)(yue)接近物理世(shi)界的真(zhen)實(shi)情況(kuang)。算力則(ze)是(shi)訓練效(xiao)率(lv)的決定(ding)性(xing)因素,是(shi)跑贏競爭對手的關鍵。測試環節更(geng)多(duo)是(shi)決定(ding)了(le)產品落地(di)效(xiao)果(guo)(guo),以(yi)及(ji)穩(wen)定(ding)性(xing)。

硅谷巨頭的選擇出奇一致,都在拼算力。openAI CEO 阿爾特曼表示(shi),計劃籌集 8 萬億美元投資 AI 芯片,徹底解決(jue) AI 大模(mo)型(xing)訓練的算力問題(ti)。微軟、Meta、谷歌等大廠在(zai)(zai)瘋狂囤積英偉達(da) H100 的同時(shi),還在(zai)(zai)抓緊時(shi)間自研芯片。這些原本為文(wen)本生成大模(mo)型(xing)準備的殺(sha)招,現在(zai)(zai)能(neng)完美應用到視頻大模(mo)型(xing)身上。

國(guo)信證券(quan)在最新(xin)一(yi)份研(yan)報中指出,相較于 ChatGPT 等文(wen)本生(sheng)成類大(da)模(mo)型,Sora 訓練(lian)數(shu)(shu)據(ju)量(liang)明(ming)顯高出一(yi)個級別,對算力的(de)要求自(zi)然(ran)也(ye)更苛刻了。根據(ju)該研(yan)報援(yuan)引(yin)的(de)數(shu)(shu)據(ju),以(yi)全(quan)球最大(da)視(shi)頻分享網站 YouTube 為數(shu)(shu)據(ju)源,一(yi)年的(de)增量(liang)視(shi)頻大(da)約(yue)為 157.68 億秒,即便是采用(yong)英偉達最先進的(de) H100,單(dan)次訓練(lian)也(ye)需(xu)要一(yi)個月,GPU 消耗量(liang)為 156.98 萬張。

眾所周知,H100 長期處于供不應求狀態。加上不可抗力影響,國內的大廠們在算力這一塊大概率會落后于硅谷巨頭,唯有在其他環節努力縮短差距。相較之下,字節在訓練數據源這一塊就比其他大廠更有優勢。

要(yao)知道(dao),Sora 對比(bi)其(qi)(qi)早(zao)前的(de) PixelDance、Stable Video Diffusion 等(deng)未成形視(shi)頻(pin)(pin)大模(mo)型有(you)顯(xian)著(zhu)提升,數(shu)據量是很關鍵的(de)一點。抖音和(he) TikTok 是國內(nei)和(he)海外市場用(yong)戶、創(chuang)作者規模(mo)最大的(de)短視(shi)頻(pin)(pin)應(ying)用(yong),擁有(you)最多的(de)短視(shi)頻(pin)(pin)內(nei)容,可用(yong)于(yu)訓練大模(mo)型。更不(bu)用(yong)說,字節(jie)旗下還(huan)有(you)今日(ri)頭條、西瓜視(shi)頻(pin)(pin)等(deng)內(nei)容庫(ku),完全(quan)不(bu)愁(chou)數(shu)據源(yuan)。不(bu)過其(qi)(qi)他(ta)大廠也不(bu)會落(luo)后太多,而且肯定會想方設法抹平(ping)差距。

這(zhe)幾(ji)天的(de)觀察下來,和當初同(tong)樣(yang)出道(dao)即紅遍(bian)全球的(de) ChatGPT 不同(tong),業(ye)界人士對 Sora 的(de)態度除了贊(zan)嘆、敬(jing)佩,還(huan)帶著(zhu)更(geng)(geng)(geng)深的(de)恐懼。這(zhe)不僅是(shi)因為 Sora 的(de)視覺沖擊力比(bi) ChatGPT 更(geng)(geng)(geng)強(qiang),還(huan)因為前(qian)者(zhe)對相應產業(ye)的(de)改變路徑(jing)是(shi)相當清晰的(de)——這(zhe)也決定(ding)了大廠會傾注更(geng)(geng)(geng)多的(de)資源,務求盡快打(da)贏這(zhe)場硬仗。

總而言之," 千模大(da)戰 " 已經進入新(xin)的階段。假以時(shi)日,我(wo)們肯定能(neng)看(kan)到(dao)很多中文(wen)版 Sora。只(zhi)(zhi)不(bu)過對大(da)廠來說,既(ji)然(ran)不(bu)可能(neng)成為 " 唯(wei)一(yi) ",就只(zhi)(zhi)有爭下 " 第一(yi) " 才有意(yi)義。

 

集團總部、集團營銷中心:金山區石化街道115號
普洱廠部:寶山區張廟街道256號
服務熱線:020-13658441256

微信公眾號

微博

Copyright © 2024 百姓彩票 All Rights Reserved. @TIANHANET 網站地圖