奧丁科技希望基于自研的硬件、軟件、算法和AI等綜合能力,讓數(shù)字人更加逼真和智能,并通過(guò)仿生學(xué)和人類學(xué)研究不斷降低成本,增加產(chǎn)能,完成超寫(xiě)實(shí)數(shù)字人的普及。
作者|黃澤正
這是新聲Pro「虛實(shí)之間」系列文章第8篇
在當(dāng)前大熱的元宇宙話題下,數(shù)字人似乎也成為了焦點(diǎn)。究其原因,在過(guò)往的PC互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)時(shí)代,主要的信息載體是圖片、文字,因此交互方式以電腦鼠標(biāo)和手機(jī)觸屏為主,但這種交互方式與人真實(shí)的交互習(xí)慣相去甚遠(yuǎn)。
奧丁數(shù)字人歌手
而如果將數(shù)字人視作新一代交互載體,其以語(yǔ)言、聲音和動(dòng)態(tài)的三維視頻圖像為主的交互方式,無(wú)疑更接近真人,也契合了元宇宙顛覆移動(dòng)互聯(lián)網(wǎng)的設(shè)想。
但另一方面,顛覆性的想象意味著前所未有的難度。當(dāng)前的數(shù)字人賽道看似風(fēng)光無(wú)限,但從呈現(xiàn)效果、制作周期、制作成本等多個(gè)角度,數(shù)字人好看的皮囊,以及「智慧」程度都還遠(yuǎn)未達(dá)到「元宇宙人」的級(jí)別。
「新聲Pro」找到了為某衛(wèi)視綜藝節(jié)目虛擬藝人提供數(shù)字化服飾技術(shù)的團(tuán)隊(duì),面對(duì)尚處野蠻生長(zhǎng)的市場(chǎng)和眾多概念公司,奧丁科技一直基于自研的硬件、軟件、算法和AI等綜合能力,讓數(shù)字人更加逼真和智能,并通過(guò)仿生學(xué)和人類學(xué)研究不斷降低成本,增加產(chǎn)能,完成超寫(xiě)實(shí)數(shù)字人的普及。公司經(jīng)過(guò)2年多的研發(fā),正式推出了奧丁數(shù)字智慧人。
奧丁科技數(shù)字人Yola
奧丁科技業(yè)務(wù)負(fù)責(zé)人張玥說(shuō):「某種程度上奧丁科技算是個(gè)異類,因?yàn)槲覀儾涣?xí)慣按行業(yè)原有的方向前進(jìn),而更希望通過(guò)自身數(shù)字人底層技術(shù)的突破,成為整個(gè)行業(yè)的破局者,真正地為元宇宙造仿生學(xué)智慧人。」奧丁的名字也是借鑒了北歐神話中眾神之父奧丁賦予人類生命和靈魂之意。
不趕風(fēng)口,只講需求
一方面,現(xiàn)在的數(shù)字人與元宇宙似乎呈現(xiàn)綁定關(guān)系,眾多從業(yè)者及投資人紛紛跑步入場(chǎng),唯恐錯(cuò)失良機(jī)。一時(shí)間做數(shù)字人不提元宇宙者,頗有與時(shí)代脫節(jié)之嫌。
但另一方面,需要明確的是,元宇宙代表的是對(duì)未來(lái)美好愿景的集合,其中所涉及到的VR&AR、AI、引擎、動(dòng)作捕捉、3D仿真等諸多先進(jìn)技術(shù),即使沒(méi)有元宇宙的概念,也會(huì)穩(wěn)步向前發(fā)展,數(shù)字人技術(shù)便是其中典型。
張玥表示,奧丁科技團(tuán)隊(duì)已經(jīng)在這個(gè)領(lǐng)域投入科研2年多,并不是盲目追逐元宇宙的風(fēng)口,公司對(duì)數(shù)字人一直保持著底層技術(shù)的研究,已經(jīng)掃描制作完成上百個(gè)數(shù)字人模型,其中還包含諸多明星。
數(shù)字藝人復(fù)原
根據(jù)奧丁科技的觀察,市場(chǎng)對(duì)數(shù)字人有很大需求,而且需求長(zhǎng)期存在。
市場(chǎng)研究機(jī)構(gòu)量子位發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報(bào)告》指出,預(yù)測(cè)到2030年,中國(guó)虛擬數(shù)字人整體市場(chǎng)規(guī)模將達(dá)到2700億元。
首先在傳統(tǒng)的游戲領(lǐng)域,作為目前數(shù)字人應(yīng)用最多的場(chǎng)景,在游戲中數(shù)字人可以作為游戲角色存在,或擔(dān)任游戲NPC,對(duì)玩家完成任務(wù)指引,提升玩家游戲體驗(yàn)感。而跳脫出游戲范疇,在其他領(lǐng)域,數(shù)字人也有廣泛的應(yīng)用場(chǎng)景。
以服務(wù)型數(shù)字人為例,大體可分為虛擬偶像,虛擬主播,虛擬導(dǎo)覽三大類。其中虛擬偶像可以服務(wù)于音樂(lè)、影視、MCN機(jī)構(gòu),生產(chǎn)優(yōu)質(zhì)內(nèi)容;虛擬主播則可應(yīng)用于電商、短視頻、游戲直播等領(lǐng)域,創(chuàng)造經(jīng)濟(jì)效益;虛擬導(dǎo)覽則可用于政府代言,虛擬導(dǎo)覽,提供便民服務(wù)。
虛擬手語(yǔ)主播
但旺盛的市場(chǎng)需求背后,是貧瘠的數(shù)字人生產(chǎn)能力。
在加盟奧丁科技之前,張玥曾擔(dān)任文投控股(成龍耀萊文化)總經(jīng)理,并主導(dǎo)并購(gòu)了世界第三大特效公司Framestore。20年來(lái)對(duì)公司戰(zhàn)略,市場(chǎng)和運(yùn)營(yíng)管理的經(jīng)驗(yàn),以及豐富的海外工作背景,讓張玥對(duì)影視特效、游戲以及AI的新動(dòng)向非常敏感。
她發(fā)現(xiàn)如果以傳統(tǒng)的電影特效制作數(shù)字人,制作過(guò)程需要用CG技術(shù)一點(diǎn)點(diǎn)精雕,雖然呈現(xiàn)效果優(yōu)質(zhì),但數(shù)字人的制作成本非常高昂,好萊塢有時(shí)一秒鏡頭可能耗資就在百萬(wàn)美元,而且制作周期很長(zhǎng)。
既然市場(chǎng)存在需求,且現(xiàn)有的技術(shù)方案無(wú)法解決,自然意味著更大的發(fā)展前景。
技術(shù)極客
在決定進(jìn)入數(shù)字人市場(chǎng)后,奧丁科技很快確定了公司發(fā)展的方向:分階段「做表演級(jí)的數(shù)字智慧永生人。」
第一目標(biāo)是數(shù)字人先能表演,不僅要在皮膚、頭發(fā)、衣著等外表上與真人形似,還應(yīng)該能通過(guò)一顰一笑、傷心流淚等表情傳遞情緒,達(dá)到神似的效果。而且整個(gè)生產(chǎn)過(guò)程應(yīng)該又好又快,最終達(dá)到可批量化生產(chǎn)超寫(xiě)實(shí)數(shù)字人。
奧丁國(guó)風(fēng)數(shù)字人表演
第二目標(biāo)是整合多種技術(shù)實(shí)現(xiàn)數(shù)字人的智慧,由AI學(xué)習(xí)系統(tǒng)、腦科學(xué)和語(yǔ)言聲音系統(tǒng)共同完成。最終目標(biāo)則是數(shù)字永生,也就是賦予未來(lái)的數(shù)字人「靈魂」,讓其擁有性格與思維,并可以自我進(jìn)化。
在當(dāng)前數(shù)字人市場(chǎng)上,以單點(diǎn)打爆做IP營(yíng)銷者有之,也不乏批量化生產(chǎn)較為粗糙的二次元虛擬形象者。但如奧丁科技定位在生產(chǎn)超寫(xiě)實(shí)數(shù)字人,同時(shí)要兼顧產(chǎn)能和效率的公司,其實(shí)并不多見(jiàn)。
奧丁科技首席技術(shù)官 Grissom介紹說(shuō):「我們做事方式很獨(dú)特,因?yàn)槲覀儾粫?huì)覺(jué)得行業(yè)都這么做,就應(yīng)該如此。對(duì)奧丁科技來(lái)說(shuō),不僅要把數(shù)字人做好,還應(yīng)該以技術(shù)極客的方式做好。」
奧丁科技技術(shù)極客的風(fēng)格與其團(tuán)隊(duì)構(gòu)成有很大的關(guān)系。
奧丁科技身后有兩位參與創(chuàng)辦公司的天使投資人,一位是華文創(chuàng)投的創(chuàng)始人姜山,有20年互聯(lián)網(wǎng)科技和文娛產(chǎn)業(yè)經(jīng)驗(yàn),堅(jiān)持以科技與內(nèi)容為核心,圍繞年輕人未來(lái)娛樂(lè)消費(fèi)場(chǎng)景投資,孵化新物種新模式;另一位是智慧基石創(chuàng)始人雷鳴,是百度七劍客之一,北大人工智能創(chuàng)新中心主任,一直致力于AI領(lǐng)域研究。同時(shí)奧丁科技的產(chǎn)品負(fù)責(zé)人Grissom是做游戲出身,曾擔(dān)任過(guò)Gamebryo引擎的亞洲區(qū)技術(shù)支持,也做過(guò)硬件和驅(qū)動(dòng)技術(shù),擁有綜合的技術(shù)能力。
奧丁科技自研多款應(yīng)用工具
據(jù)「新聲Pro」了解,目前奧丁科技的團(tuán)隊(duì)規(guī)模在50人左右,其中研發(fā)人員占比在90%以上。
奧丁科技首席技術(shù)官 Grissom表示,公司在搭建團(tuán)隊(duì)時(shí),所挑選的都是各方面的尖端人才,所涉及的面也很廣泛。既有做電影特效出身,把握鏡頭和呈現(xiàn)效果的技術(shù)人員;還有一部分是IT人才,負(fù)責(zé)軟件和算法優(yōu)化;還包括一些硬件公司的人才。「我們從硬件到軟件到算法都有團(tuán)隊(duì)。」
扎實(shí)的研發(fā)團(tuán)隊(duì),讓奧丁科技科技可以通過(guò)技術(shù)革新,解決大量數(shù)字人市場(chǎng)上存在的困局。
在最直觀的靜態(tài)呈現(xiàn)方面,當(dāng)前數(shù)字人的呈現(xiàn)效果并不理想,尤其是在對(duì)真人的還原上,大部分還是偏重于二次元風(fēng)格的設(shè)計(jì)。
以數(shù)字人的面部效果為例,原本要達(dá)到影視級(jí)的皮膚、毛孔細(xì)節(jié),需要藝術(shù)家花費(fèi)大量時(shí)間進(jìn)行雕刻。而奧丁科技則可以通過(guò)畫(huà)面捕捉、體感控制及畫(huà)面渲染技術(shù),還原數(shù)字人面部的各個(gè)細(xì)節(jié),讓數(shù)字人纖毫畢現(xiàn)。
奧丁數(shù)字人面部細(xì)節(jié)
在具體操作步驟上:奧丁技術(shù)團(tuán)隊(duì)會(huì)使用自研的硬件設(shè)備,配合數(shù)據(jù)采集手段完成數(shù)據(jù)掃描,之后結(jié)合數(shù)據(jù)處理系統(tǒng),和深度學(xué)習(xí)的算法,還原數(shù)字人皮膚和毛孔細(xì)節(jié)。保證生產(chǎn)的數(shù)字人模型在拉到近景特寫(xiě)后,毛孔和皮膚紋理等細(xì)節(jié)都可以真實(shí)還原。據(jù)悉,奧丁科技的3D數(shù)字資產(chǎn)積累已經(jīng)達(dá)到了十幾T,在行業(yè)內(nèi)是極為少見(jiàn)的。
除了靜態(tài)呈現(xiàn),數(shù)字人還面臨著另一個(gè)更高維度的技術(shù)難題:無(wú)法做到對(duì)真人表情的還原,從而傳遞情感。即便是由Epic出品的全球頂尖虛擬形象生成軟件Metahuman,其所制作的數(shù)字人也無(wú)法傳達(dá)微表情。
Grissom表示,在經(jīng)過(guò)詳盡的市場(chǎng)調(diào)研后,他發(fā)現(xiàn)市場(chǎng)上主流做數(shù)字人表情的思路,都是「最終呈現(xiàn)」。也就是說(shuō)觀眾看到的只是一個(gè)單純的笑容,或者流淚表情,而并不是一個(gè)從不笑到笑,從不哭到哭的動(dòng)態(tài)過(guò)程。但在現(xiàn)實(shí)情況中,人的情感波動(dòng)再由表情傳達(dá),必定是一個(gè)動(dòng)態(tài)變化的過(guò)程。
因此奧丁的思路是還原表情的變化過(guò)程。為此團(tuán)隊(duì)推出了「表情方案+表情驅(qū)動(dòng)」的解決方案。
通過(guò)自主研發(fā)的硬件設(shè)備,微表情級(jí)別的數(shù)字人面部捕捉系統(tǒng),配合綁定系統(tǒng)以及面部驅(qū)動(dòng)方案,奧丁科技可以讓數(shù)字人表情還原度超過(guò)90%,且具有一定的表演能力。
匹配應(yīng)用場(chǎng)景
張玥表示,「數(shù)字人市場(chǎng)有很大的想象空間,在完成一定的技術(shù)積淀后,奧丁科技希望將成熟的技術(shù)匹配到更大的應(yīng)用場(chǎng)景,同時(shí)研發(fā)新技術(shù),去引領(lǐng)應(yīng)用場(chǎng)景走向新階段,最終由TO B走向To C,這個(gè)戰(zhàn)略公司會(huì)長(zhǎng)期堅(jiān)持。」
在當(dāng)前階段,奧丁科技技術(shù)的主要應(yīng)用場(chǎng)景,還是在服務(wù)B端客戶。
據(jù)「新聲Pro」了解,目前奧丁科技已經(jīng)與多位行業(yè)客戶進(jìn)行合作,包含影視、電競(jìng)、音樂(lè)、動(dòng)畫(huà)、電商、短視頻、直播、綜藝、文旅、奢侈品等。比如為影星克拉拉打造了完整的面部、肢體、表情等全部數(shù)字人資產(chǎn);為《前沿訪談》打造商業(yè)大佬們的數(shù)字分身;數(shù)字服裝潮牌;為NFT產(chǎn)品提供虛擬場(chǎng)景。
奧丁科技首席技術(shù)官 Grissom透露,在為某衛(wèi)視綜藝節(jié)目虛擬人制作全套服裝時(shí),由于需要配合節(jié)目的錄制檔期,同時(shí)還要在錄制現(xiàn)場(chǎng)虛擬人和眾多真人明星完成互動(dòng),對(duì)時(shí)間要求非常迫切。最終的結(jié)果來(lái)看,奧丁的數(shù)字化服裝和綁定的呈現(xiàn)效果收獲了眾多好評(píng),傳統(tǒng)的虛擬人制作公司需要3月的時(shí)間,而奧丁利用自己的材質(zhì)硬件設(shè)備開(kāi)發(fā)周期僅在1周左右,并用于直播,完成了客戶緊急要求,這些都離不開(kāi)奧丁科技在技術(shù)端的創(chuàng)新。
姜山、吳歷華數(shù)字替身出現(xiàn)在 EDG 電競(jìng)節(jié)目中
當(dāng)前階段,數(shù)字人在進(jìn)行模型制作和數(shù)據(jù)采集時(shí),主流方案還是大量采購(gòu)單反相機(jī)組成3D矩陣,輔以人工大量修復(fù),這樣的操作流程無(wú)疑需要更高的時(shí)間成本和人力成本。而奧丁科技通過(guò)自研的虛擬技術(shù)系統(tǒng),讓數(shù)字內(nèi)容在研究、制作、使用等各個(gè)環(huán)節(jié)變得更加規(guī)范,可以通過(guò)標(biāo)準(zhǔn)化操作提升效率。
Grissom表示,由于整個(gè)公司90%都是技術(shù)極客,因此做事的方式就是會(huì)把任何一個(gè)重復(fù)的勞動(dòng)變成程序化操作,「只要是電腦能干的事我們就絕對(duì)不用人工。」同時(shí)內(nèi)部有一套自己的工作流程,除了人工處理數(shù)據(jù)修復(fù)的部分,團(tuán)隊(duì)在平時(shí)就會(huì)大量去做內(nèi)部的工具,因此團(tuán)隊(duì)的執(zhí)行能力和生產(chǎn)效率都很高。
除此之外,奧丁團(tuán)隊(duì)還對(duì)接了工業(yè)生產(chǎn)中服裝建模的流程,可以完成工業(yè)級(jí)別的服裝仿真結(jié)算。相比于傳統(tǒng)的3D建模軟件,對(duì)接工業(yè)設(shè)計(jì)模型既能讓數(shù)字人服裝的物理真實(shí)度更佳,也能使服裝生產(chǎn)效率得到提升。
服裝布料系統(tǒng)
張玥認(rèn)為,盡管目前公司以服務(wù)行業(yè)客戶為主,但根據(jù)不斷升級(jí)的技術(shù)能力和奧丁對(duì)數(shù)字人四個(gè)階段的規(guī)劃,公司未來(lái)會(huì)進(jìn)入更廣大的C端市場(chǎng),真正完成數(shù)字人的普及和生長(zhǎng)。當(dāng)前公司擁有的多項(xiàng)硬件與軟件知識(shí)產(chǎn)權(quán);可服務(wù)于AI深度學(xué)習(xí)的3D數(shù)字資產(chǎn);影視級(jí)面部及身體動(dòng)作捕捉系統(tǒng)等一系列技術(shù)優(yōu)勢(shì),都將繼續(xù)迭代,以數(shù)字人為入口,面向下一代高互動(dòng)性的VR內(nèi)容。
關(guān)鍵詞: 奧丁科技為元宇宙造智慧人|虛實(shí)之間




