AIGC浪潮下,機器有了可以與人溝通的“智慧”和“靈魂”,數字人技術則提供了機器與人交流時的“外形”和“樣貌”。於是,“數字永生”便有了可能。
這是新華智雲副總裁周劼人的視頻片段,請問,視頻中的周劼人是真人還是數字人呢?事實上,她是從外形到聲音完全由AI製作而成的數字人。
眾所周知,數字人已經成為鏈結數實世界的紐帶,也是我們進入元宇宙的關鍵入口。IDC在《中國AI數字人市場現狀與機會分析,2022》報告中預計,到2026年中國AI數字人市場規模將達到102.4億元。
浪潮之下,依託AI技術驅動的數字人,將成為未來數字人市場的主流。
當下,數字人製作和運營高昂成本,制約了市場規模的擴大和應用落地。如何從建模、驅動、渲染等多方面降低數字人成本,提高製作效率,是目前各行各業入駐元宇宙首要考慮的因素。
隨着ChatGPT浪潮掀起,沉寂已久的AI再次成為熱門話題,並理所當然地成為了數字人“降本增效”的有利武器。
新華智雲是國內較早投身數字人的科技公司之一,2019年便試水數字人,開創了新聞領域實時音頻與AI真人形象合成的先河。2020年的地方兩會報道中,有7省的兩會報道使用新華智雲虛擬主播。截至2023年2月,超過500家媒體、政府機構、金融機構、會議會展企業使用新華智雲虛擬主播。
得益於多年MGC(機器生産內容)和數字人技術儲備,新華智雲如今已具備AI全鏈路生産數字人的能力,AI訓練出的數字,不僅外形逼真,類型多元,而且生産速度不斷加快,成本日漸降低,應用場景越發全面。
借助AI讓各行各業實現“數字人自由”,已成現實。
AI自動生成的不同數字人類型
“真”——以假亂真的2D倣真數字人
縱觀當今數字人市場,2D倣真類數字人最為常見。前文視頻中周劼人數字形象就屬於典型2D倣真數字人。倣真,倣真,自然繞不開“真不真”這一關鍵問題。
2018年,新華社推出全國首個AI合成虛擬主播,經過幾年發展,以“華智雲”為代表的AI新聞主播、AI金融客服等2D倣真數字人在市場上屢見不鮮,但衡量標準卻始終如一——就是一個“真”字。
這幾年,國內外各大科技企業都在想方設法地從外形、表情、聲音和動作等方面追求極致逼真,以真正實現1:1復刻,或者真人“克隆”。
其中,有企業訓練的數字人逼真程度很高,但價格在幾十萬元到上百萬元不等;有的可能省時省力省錢,但訓練出的數字人太過機械,逼真度和靈活度都不盡如人意。
新華智雲數字人恰恰就居於兩者之間,借助AI能力,萬元級別的價格,就能達到足以亂真的效果。
新華智雲數字人製作&&(移動端)
基於深度學習模型、動作模擬、情感模擬等智能科技,只需採集2-5分鐘的真人視頻,AI最快訓練1小時,即可生成形象逼真、表情到位、口型匹配的數字分身。
相比過去,現在數字人面部精細度更高,發音和口型更精準,肢體動作更自然,而且數據採集時間縮短75%,訓練速度更是提高約100倍。
越接近真人外形的數字人,越能提供更親切、自然、高效的服務體驗,讓人産生信任。因此,2D倣真類數字人往往適合社交、媒體、金融、電商直播、教育等需要“多交流”“高互動”的場景。數字人可以“扮演”主持人、新聞主播、金融客服、導購員、講解員、直播博主、老師等角色。在新華智雲數字人製作&&中輸入文字,一段由數字人播報和講解的視頻,就可以快速生成。
新華智雲數字人製作&&(PC端)
此外,接入不同的對話模型(如Chat GPT),數字人還可以實現面對面交流,讓人機交互更真實。&&中的換背景、換綠幕等功能,也可以滿足不同客戶的個性需求。
“像”——一圖即得3D寫實數字人
2D數字人好在逼真,但終究還是“紙片人”。在虛擬偶像“筱竹”“柳夜熙”大行其道的年代,3D寫實數字人也是不少場景的新需求。
與製作純虛擬數字人的企業不同,新華智雲將目光聚焦於如何用更“省”成本的方式,打造更“像”的虛實融合型數字人。
新華智雲數字人製作&&自動生成的3D寫實數字人視頻
提供一張真人正面照片,上傳到新華智雲數字人製作&&,即可生成一個具有真人五官特點的3D寫實數字人。新華智雲充分發揮AI技術優勢,優化數字人生産流程,縮短製作時間,大大降低了數字人製作成本,將原來動輒幾十萬元的3D寫實數字人價格壓縮至千元級。
通過算法訓練及優化、多模態信息識別等技術,數字人表情、動作更加生動和細膩,可以滿足喜怒哀樂等面部表情和其他動作變化需求。如對聲音有要求,還可以復刻真實聲音。新華智雲在控製成本的前提下,一定程度上保證了數字人的相似度。
目前,3D寫實數字人主要應用於數字人新聞播報、直播、文旅等場景。
文旅場景-AI生成的3D虛擬古裝形象
其中文旅場景的應用以游客掃臉生成3D形象為典型,結合文化數據資源,通過文化挖掘與智能交互等技術,增加了文化的互動性和有趣性,讓數字人走入尋常百姓家。2022年深圳文博會上,讓游客數字分身入畫的“新華智雲數字文化互動長卷”,在現場就吸引了不少游客參觀體驗。
“輕”——無限暢游的3D輕量版數字人
實時顯示3D數字人非常“吃”本地硬體性能,一般手機要保持運行流暢,在一個畫面中最多同時出現五個3D數字人,這顯然無法滿足大訪問量和多人要求的商業場景。
因此,新華智雲推出3D輕量版數字人,正好滿足了這方面需求。它可以通過輕量級Web引擎運行,不僅渲染速度快,成本低,而且支持上百人同框暢游,可通用於各種元宇宙空間。
釘釘企業展廳中的數字人
在元宇宙空間,用戶可以基於已有的虛擬模板,根據自身喜好“捏出”人物的五官和妝容,借助AI技術,還可以選擇虛擬衣着鞋履、虛擬配飾等,創建個性化的虛擬化身。
此外,用戶還可以自由操作虛擬化身,在元宇宙空間中自由移動、跳躍,參與元宇宙社區的游覽、社交、游戲及其它娛樂活動。新華智雲打造的紅旗元宇宙社區、釘釘企業展廳等虛擬空間,都配有這類數字人服務,並且設置了相應玩法,帶來更好的元宇宙體驗。
不久前,剛獲5600萬美元融資的初創公司Ready player me做的就是這個“生意”。
不過,比Ready player me更“厲害”的是,新華智雲3D輕量版數字人還支持真人復刻。只需上傳照片,就能生成五官相似的虛擬化身。這意味着在未來元宇宙裏,用戶將有可能通過辨認數字人的五官來判斷每個人的現實角色,這會帶來更加沉浸式地元宇宙體驗,進一步加強虛擬與現實的連接。
2022年12月,財經大V吳曉波預測“2023年每一家公司都可能需要一個數字人”。2023年初,ChatGPT等語言模型的接入又為數字人注入強大的“AI大腦”。AI數字人的商業價值已日益凸顯,並成為各行業打造競爭優勢的重要力量。
因此,新華智雲將全面開放所有類型的數字人API,只要獲得授權許可,就可以接入任何元宇宙&&或語言模型。無論是基於服務場景使用的智能客服、新聞主播等服務型數字人,還是為了營銷使用的品牌虛擬IP,都可以通過新華智雲數字人能力在元宇宙場景中大放異彩,帶來更優質、更便捷的交互體驗。
新華智雲數字人“小雲”與真人進行對話
未來,新華智雲AI全鏈路生産數字人的能力,將提升數字人的製作效率,低成本推動數字人大規模應用落地,為政企事業、品牌、機構創造更大的價值,助力實現數字人自由。