新華網 正文
“她”來了!全球首位3D版AI合成主播精彩亮相
2020-05-20 21:16:48 來源: 新華社
關注新華網
微博
Qzone
評論
圖集

新華社北京5月20日電(記者鄔金夫)她能隨時變換發型,她能隨時更改服裝,她能穿梭于演播室的不同虛擬場景中……然而,她卻不是真人,她是全球首位人工智慧驅動的3D版AI合成主播。

↑“新小微”走進虛擬演播室。

“大家好,我叫新小微,是由新華社聯合搜狗公司推出的全球首位3D版AI合成主播,我將為大家帶來全新的新聞資訊體驗。”

一段“未來感”十足的視頻播報畫面讓人眼前一亮,全球首位3D版AI合成主播在全國兩會開幕前夕正式亮相,這是繼全球首位AI合成主播、站立式AI合成主播、AI合成女主播、俄語AI合成主播之後,新華社智能化編輯部聯合搜狗公司最新研發的智能化産品。

“新小微”是如何誕生的?

“新小微”的原型是新華社記者趙琬微,採用最新人工智慧技術“克隆”而成。從外型上看,“新小微”高度還原真人發膚,在立體感、靈活度、可塑性、交互能力和應用空間等方面,較前一代AI合成主播(2D形象)有了大幅躍升。在特寫鏡頭下,甚至連頭髮絲和皮膚上的毛孔都清晰可見。

3D版AI合成主播,是如何誕生的?

“‘新小微’的研發,經歷了極其復雜的過程。”據項目負責人介紹,研發人員進行了海量數據採集工作。趙琬微戴著數據採集頭盔,幾百個攝像頭對其身體部位360度全方位“打點”掃描,採集每一處細節,並對其多種形態的表情和動作進行細致入微的捕捉記錄。

↑趙琬微正在進行數據採集,3D渲染由原力科技公司提供技術支援。

“就像拼樂高一樣,我們對‘新小微’的各個部位和表情進行了模組化處理,然後重新組裝。”項目負責人解釋説,通過演算法實時驅動、渲染構建出來的3D數字人物模型,表情唇動、肢體動作和語言表達實現了高度契合。

據介紹,目前絕大部分“能動”的3D數字人,主要是靠真人驅動。而“新小微”採用的是人工智慧驅動,輸入文本後,AI演算法便可實時驅動“新小微”,生成的語音、表情、唇動更接近于真人。

“新小微”實現了哪些升級進化?

和前一代AI合成主播相比,“新小微”實現了從單一景深機位到多機位多景深、微笑播報到多樣化精微表情播報等進步,播報形態可通過不同角度全方位呈現,立體感和層次感明顯增強。

↑“新小微”在站姿狀態下播報新聞。

“前一代AI合成主播只能在坐姿或站姿下做一些簡單的手勢。‘新小微’不僅能走動和轉身,還能擺出各種復雜動作和姿態,靈活性大大提升了。”項目負責人介紹。

此外,“新小微”以其“微模組化”的特性,實現了靈活“變粧”。她的發型、服飾均能根據不同新聞和場景變換,這些功能也是前一代AI合成主播所不具備的。

↑“新小微”播報新聞,面部表情生動自然。

“可以説,3D版AI合成主播在多方面都更加智能化了,在人工智慧的實時驅動下,可實現功能持續自我更疊。”項目負責人説。

“新小微”將開啟怎樣的未來想像?

作為新聞界首位由人工智慧驅動、3D技術呈現的AI合成主播,“新小微”在今年全國兩會期間可量化生産新聞播報視頻。

只需要在機器上輸入相應文本內容,“新小微”就能播報新聞,並根據語義生成相對應的面部表情和肢體語言。

“隨著後期自我更疊和進化,‘她’的工作空間會更大。”項目負責人説,隨著3D虛擬場景不斷拓展,“新小微”將走出演播室,在不同場景中更好地滿足新聞呈現的多樣化需求。

↑“新小微”的播報形態可通過不同角度全方位呈現。

2018年11月7日,新華社聯合搜狗公司發布全球首位AI合成主播,“克隆”出與真人主播擁有同樣播報能力的“分身”。此後又不斷迭代升級和擴容,業界評論這是人工智慧技術在新聞領域的開拓性應用。

作為新華社AI合成主播家族的最新成員,3D版AI合成主播在今年全國兩會期間將通過新華社客戶端為廣大網友帶來全新的新聞資訊體驗,也將進一步助力新華社智能化編輯部建設,推動媒體融合向縱深發展,為新聞生産的“未來場景”開辟新空間。

總策劃:劉思揚

出品:陳凱星、周亮

策劃:齊慧傑

監制:何強、曹曉軒

統籌:李瑜、盧靜娜

海報設計:潘紅宇

視頻制作:胡碧霞

新華社新媒體中心&搜狗公司聯合出品

  相關連結:

  3D AI合成主播丨全國政協十三屆三次會議21日15時開幕

+1
【糾錯】 責任編輯: 王佳寧
新聞評論
載入更多
重慶高校大學生有序返校
重慶高校大學生有序返校
鳥瞰珠峰
鳥瞰珠峰
海拔7000米以上的壯美景色
海拔7000米以上的壯美景色
中國國家圖書館恢復開放
中國國家圖書館恢復開放

010020020110000000000000011199211126011533