于科技發(fā)展史而言,20世紀60年代前后是一段非常神奇的歲月。
彼時,世界第一顆人造衛(wèi)星進入太空;第一臺工業(yè)機器人尤尼梅特誕生于世;人類完成登月第一步;微電子學和自動化技術(shù)開始躍升……在此背景下,主流科幻小說對人性本質(zhì)的探索有了更深刻的立意。
科幻鬼才菲利普?迪克的作品《仿生人會夢見電子羊嗎?》就出版于這一時期。這本書提出了這樣一個問題:當仿生人在外表和心智上無限逼近人類,甚至表面上已經(jīng)超越人類時,人究竟何以為“人”?這個看上去更像是哲學層面的議題,在半個多世紀過去以后,卻開始無限地逼近現(xiàn)實。

圖源:豆瓣
伴隨著元宇宙概念的走紅,虛擬數(shù)字人來到了聚光燈下。從去年至今,各行各業(yè)的虛擬數(shù)字人不斷涌現(xiàn),在不同的場景中頻頻亮相。形形色色的虛擬主播、虛擬偶像、虛擬員工都開始屢見不鮮,它們在代替人類從事某些工作的同時也引發(fā)了一些爭議和隱憂。
捫心自問,在可預見的未來,你是會更期待自己在賽博空間的“復制體”呢,還是會更擔心數(shù)字人動了“真人”的奶酪?
數(shù)字人:如何變得更像一個“人”
雖然元宇宙推動數(shù)字人走向了大眾,但數(shù)字人本身卻并非新鮮事物。
早在上世紀80年代,數(shù)字人就有跡可循。這一時期的數(shù)字人擬人化程度較低,主要由手繪制成,制作周期長、成本高,而且僅僅在外形上實現(xiàn)了對人的模仿。
2000年以后,隨著CG、動捕、語音合成等技術(shù)的發(fā)展,以初音未來、洛天依為代表的二次元歌姬出現(xiàn)于公眾視野,并迅速獲得年輕一代的的青睞。但此時的數(shù)字人還缺少了點“靈魂”,因為他們還無法實現(xiàn)“與人交互”。

初音未來 圖源:堆糖
之后,深度學習算法、自然語言處理等AI技術(shù)的突破為數(shù)字人的發(fā)展提供了革新的基石。通常來說,數(shù)字人的核心制作流程包括建模、驅(qū)動和渲染三大環(huán)節(jié)。AI技術(shù)發(fā)展起來后,需求方可以直接利用AI參與或部分參與這些環(huán)節(jié)。
一方面能縮短制作周期、降低制作成本;另一方面,也有利于不斷提高擬人化程度,賦予數(shù)字人更逼真的類人外觀、感知和交互能力,為推動數(shù)字人在文娛、電商、金融等領域的落地應用達成先決條件。
近年來,產(chǎn)業(yè)界對數(shù)字人的探索開始向超寫實的人類形象發(fā)展。具體而言,真正的MetaHuman要達成三個層面的需求:高保真、智能化、工具化。
高保真:視覺上,從外形、表情到動作,都要做出1:1還原真人的高保真虛擬人;
智能化:運用人工智能,使虛擬人初具智能和情感表達;
工具化:開發(fā)更輕量、便捷的工具,讓普通用戶都能快速生產(chǎn)高品質(zhì)的虛擬資產(chǎn)或自己的數(shù)字孿生體。
要實現(xiàn)這些需求,除了基礎學科的支撐外,更需要一系列精密硬件、技術(shù)、算法和軟件的相互配合,還有產(chǎn)業(yè)鏈上下游的共同發(fā)展。
當前數(shù)字人產(chǎn)業(yè)鏈主要分為三層:基礎層、平臺層、應用層。

基礎層:主要為數(shù)字人的制作提供必要的基礎軟硬件支撐。硬件包括芯片、傳感器、光學器件及顯示設備等,軟件包括建模軟件及渲染引擎。
平臺層:主要提供軟硬件系統(tǒng)、生產(chǎn)技術(shù)服務平臺和AI能力平臺。生產(chǎn)技術(shù)服務平臺主要提供整體的數(shù)字人解決方案。AI能力平臺主要是基于自身人工智能技術(shù),賦予數(shù)字人進行智能感知與交互的能力。
應用層:主要指數(shù)字人與各行業(yè)場景結(jié)合形成的具體的應用解決方案。當前,文娛、傳媒、金融等是數(shù)字人應用滲透率較高、技術(shù)較為成熟的領域。
大廠:爭做“女媧”,各顯神通
從產(chǎn)業(yè)鏈的構(gòu)成,就可以窺見數(shù)字人巨大的商業(yè)潛力。盡管距離規(guī)模化普及時日尚早,大廠們也開始紛紛加碼,探索屬于自身的“造人”之路。
1、百度:基于平臺打造完整的生態(tài)鏈服務
在百度Create 2021(百度AI開發(fā)者大會)上,智能數(shù)字人平臺“百度智能云曦靈”正式發(fā)布。這一平臺集數(shù)字人生產(chǎn)、內(nèi)容創(chuàng)作、業(yè)務配置服務為一體,充分展示了百度在數(shù)字人領域的野心。
在國內(nèi)的幾家大廠中,百度第一個明確了全場景、大生態(tài)的定位。針對當下國內(nèi)數(shù)字人發(fā)展存在著產(chǎn)業(yè)鏈效率較低、上下游生態(tài)未完全打通的痛點,百度希望借助產(chǎn)業(yè)鏈協(xié)同,降低數(shù)字人開發(fā)成本,實現(xiàn)規(guī)?;a(chǎn),讓“人手一個數(shù)字人”的愿景不再遙遠。
可以看到,百度數(shù)字人的身影活躍在各行各業(yè)。為浦發(fā)銀行打造的理財專員“小浦”、為中國航天局打造的“火星車數(shù)字人祝融號”、與2022年冬奧會合作的AI手語主播等等。
此外,百度還陸續(xù)推出了自己的虛擬IP,比如“龔俊數(shù)字人”、“希加加”、“度曉曉”。除了借助IP探索品牌營銷的新路徑之外,這些IP也成為了百度對外展示自己技術(shù)底蘊的窗口?!岸葧詴浴睉獞?zhàn)高考作文的新聞一度引起熱議。
最近,百度智能云即將推出數(shù)字人直播平臺的消息再次引發(fā)關(guān)注。據(jù)公開資料,這一平臺可以提供行業(yè)頂配精度的超寫實數(shù)字人形象、實時互動的超智能對話問答系統(tǒng)以及預設豐富場景及動作模板的開播效果,助力商家實現(xiàn)AI驅(qū)動24小時不停播。這一平臺的推出對電商直播行業(yè)來說到底會產(chǎn)生怎樣的效應,我們且保持觀望。

百度數(shù)字人直播平臺宣傳視頻截圖 圖源:百度智能云
2、騰訊:聚焦服務屬性+孵化游戲IP
騰訊同樣于去年推出了自己的數(shù)字人平臺——騰訊云小微數(shù)智人平臺。與百度主張的“全鏈路、全場景”不同的是,這一平臺更突出其智能交互體驗,價值理念也更聚焦于其服務屬性,即“為用戶提供更有溫度的服務,為企業(yè)創(chuàng)造價值”。
在生活服務場景,為用戶創(chuàng)造更好的交互智能體驗,降低數(shù)字化服務使用門檻,比如在智能車載、智能交通、智能家居等場景,數(shù)字人可以通過與智能設備結(jié)合,為用戶提供智能化服務;
在企業(yè)服務場景,助力企業(yè)降本增效,提升企業(yè)服務效率和品牌形象,比如在金融、文旅、傳媒、公共服務、醫(yī)療、零售等行業(yè)場景中,可擔任客服、理財顧問、播報主持、導游導覽角色。
盡管理念有所差異,但騰訊和百度的數(shù)字人在落地場景上重合率較高。不過,基于本身的業(yè)務基因,騰訊在游戲虛擬偶像的賽道上天然優(yōu)勢明顯。無數(shù)的游戲IP為騰訊提供了孵化基礎,比如“QQ炫舞”的星瞳,作為該系列的虛擬代言人,在去年6月就開始以虛擬UP主身份在B站進行直播活動。
3、阿里:專注打造電商虛擬KOL矩陣
在2020年4月阿里舉辦的內(nèi)部會議“淘寶直播MCN機構(gòu)大會”上,淘寶宣布對虛擬主播進行重點扶持。在得到淘寶更多的政策和流量傾斜之后,虛擬主播成為了直播的新出口。
阿里數(shù)字人的布局正是基于直播帶貨場景,從品牌營銷切入,專注打造自己的虛擬KOL矩陣。“AYAYI”的出現(xiàn)就是典型。
AYAYI在小紅書亮相1個月后,就相繼與嬌蘭、保時捷等國際大牌達成了合作。2021年9月,AYAYI又成為阿里巴巴首個數(shù)字人員工,擔任天貓超級品牌日的數(shù)字主理人。2022 年 5 月,繼 AYAYI 之后,阿里媽媽又正式推出超寫實數(shù)字人男性偶像“锘亞 Noah”。
對于阿里而言,虛擬KOL不僅是超乎期待的品牌代理人,而且有助于其在更廣闊的營銷版圖上觸達更多的用戶群。今年618,AYAYI 和Noah 共同參與演繹了以“莫比烏斯”為主題的元宇宙數(shù)字大秀。
在電商直播進入下半場之際,單純的流量玩法很難再玩轉(zhuǎn)全場,而虛擬KOL的出現(xiàn),在營銷矩陣“人、貨、場”中,既是“人”又是“場”,不僅為直播生態(tài)注入了新的活力,也讓品牌跟消費者交互的延展性變得更有想象力。
4、字節(jié):虛擬偶像女團A-SOUL的“紅與黑”
相較其他大廠來說,字節(jié)跳動在數(shù)字人領域的落子就顯得比較隱晦。
盡管也提供數(shù)字人定制方面的服務,但在一眾聲名鵲起的數(shù)字人中,字節(jié)數(shù)字人給人的印象就較為稀薄。其中最為出名的應該就是A-SOUL——由旗下游戲品牌朝夕光年和樂華娛樂共同打造的虛擬偶像女團。
SOUL出道幾個月就收獲了百萬粉絲,在虛擬偶像中堪稱“頂流”。其出色的舞臺表現(xiàn)和鮮明的人設性格完全不輸當紅的真人偶像團體。在吸金能力上,A-SOUL也不容小覷。安信證券預計,樂華娛樂的泛娛樂業(yè)務收入在2021年為3790萬元,其中A-SOUL貢獻了約1700萬的增量收入。但是,在前途一片大好的發(fā)展態(tài)勢下,A-SOUL卻遭遇意外“剎車”。
伴隨成員“珈樂”的“直播休眠”聲明,一系列負面新聞甚囂塵上。這一虛擬形象背后的“中之人”長期遭受職場PUA等傳聞引來了極大爭議。沒人能否定A-SOUL的成功:全網(wǎng)粉絲逾兩千萬,登頂“國內(nèi)第一虛擬偶像女團”……但功成名就背后,觀眾對虛擬偶像的信任危機依舊無解。
對大廠來說,數(shù)字人賽道既是挑戰(zhàn),也是機遇。除了技術(shù)之外,品牌對IP和內(nèi)容的運營能力也是能否獲得長期發(fā)展的個中關(guān)鍵。所有身處或準備進入這一賽道的玩家都需要考慮清楚,在撒網(wǎng)和收網(wǎng)之間,想要的到底是要短期收益還是長期效益。
隱憂:長期發(fā)展的藩籬
當前數(shù)字人技術(shù)正在快速發(fā)展和迭代,但在欣欣向榮的表象下,數(shù)字人行業(yè)還是顯得頗為“稚嫩”。
其一,制作門檻高,成本所限難以普惠。這與數(shù)字人所需的建模、動捕、渲染等技術(shù)花銷巨大相關(guān)。數(shù)字人精度越高、效果越好,成本也越令人望而生畏。比如曾經(jīng)在英偉達發(fā)布會上以假亂真的“黃仁勛虛擬人”,據(jù)英偉達官方透露,這個僅14秒的視頻耗費了34位3D美術(shù)師和15位軟件工程師共計近千工時。
其二,產(chǎn)業(yè)鏈割裂,很難實現(xiàn)規(guī)?;a(chǎn)。數(shù)字人制作涉及形象生成、AI驅(qū)動、長期運營等環(huán)節(jié),流程多、周期長,常常需要跨界合作。對用戶來說,往往要輾轉(zhuǎn)于多個公司進行整合,溝通成本較高,對于量產(chǎn)來說效率過低。
其三,在交互體驗上依舊任重而道遠。首先,視覺表現(xiàn)不夠自然。用戶對數(shù)字人的信任,很大程度上會建立在視聽感觀上。如何讓數(shù)字人更“自然”,面部表情、眼神、肌肉運動的細膩流暢是關(guān)鍵,而這一點需要更多優(yōu)質(zhì)數(shù)據(jù)和算法的支持。其次,驅(qū)動方式也較為單一。相較用遙感或者按鍵操作,如何打造更多個性化的驅(qū)動方式會極大影響用戶體驗。在接近真人的互動體驗上,相關(guān)技術(shù)還有遠路要走。
其四,同質(zhì)化嚴重,運營能力匱乏,商業(yè)化路徑未明。作為市場熱點,大量替代真人服務的虛擬主播和具備IP潛力的虛擬偶像競相涌現(xiàn),與此同時,“同質(zhì)化”現(xiàn)象也暴露無遺。這一形勢下,哪家團隊擁有更強的內(nèi)容策劃和運營能力,才越有可能突出重圍。可惜的是,更多的數(shù)字人往往因運營的后繼乏力而“泯然眾人”。這也直接導致大多數(shù)數(shù)字人無法實現(xiàn)真正的盈利。
以上挑戰(zhàn)是整個數(shù)字人行業(yè)必須直面的問題。盡管當前的數(shù)字人在外觀上已經(jīng)較為寫實,但現(xiàn)實和虛擬的藩籬依舊不容忽視。但長遠來看,順應數(shù)字經(jīng)濟的發(fā)展趨勢,在人工智能技術(shù)的加持下,數(shù)字人在各行各業(yè)和日常生活中必會扮演更加重要的角色,甚至在元宇宙場景中,更加智能的數(shù)字人會得到更有顛覆性的進化。待到那時,回歸最初的議題:在可預見的未來,你是會更期待自己在賽博空間的“復制體”呢,還是會更擔心數(shù)字人動了“真人”的奶酪?
參考鏈接:
https://www.tmtpost.com/6175145.html
https://www.toutiao.com/article/7081963424443433480?wid=1658302887042
https://www.thepaper.cn/newsDetail_forward_19027734

























