草根影響力新視野 黎松子  

談起數字人,它其實最早起源於影視工業,早在本世紀初就在《阿凡達》中大放異彩。時隔13年借助數位技術的飛躍,《阿凡達2》貫穿全場的強大特效,更是將納威人後裔與屠鯤共舞的栩栩如生展現的淋漓盡致。

演唱會、綜藝、代言、走秀、直播,虛擬數字人全面攻陷,現如今就連我們熟知的頭部直播帶貨李佳琦也正面臨被數字人替代的風險。

從起先應用於增強觀影效果,到近年來走進金融客服、傳媒口播等,數字人應用場景的擴大越來越考驗其逼真程度,要做到逼真,就要讓數位人既擁有好看的皮囊,又具備有趣靈魂,現在很多數字虛擬人都做到了,而且還越來越酷呢!

Part1 好看的皮囊

AI賦能、三維重建演算法以及生成AI技術,通過建模、渲染、動作捕捉和AI驅動技術能夠讓數位人的外貌更加精緻,形象更加逼真,動作更加自然。換句話說就是皮囊更好看了

跨越恐怖穀效應後,會讓人覺得數字人和真人無異,建立良好的心理連接。

駿眉秋眼、顧盼神飛,從800年前的南宋穿越而來,美少女虛擬人谷小雨出現在美麗的杭州城,並在2022宋韻文化節開幕式上驚豔亮相,粉絲們經不住感歎,谷小雨也太好看了吧!她是由浙江省委宣傳部指導,浙江廣電集團ZMG旗下的浙江衛視聯合騰訊互娛CROS知己團隊共同打造的宋韻文化推廣人,同時還是浙江衛視虛擬主持人。

國潮復興,我們太需要這樣美美國風小姐姐了。

再看這家數字人,走的是個性風,福克斯電視臺做的一檔虛擬數字人歌唱大賽《ALTER EGO》節目,全球第一檔虛擬人物歌手大賽。

“Alter Ego”來自拉丁語,意為“另一個自我”,通常被認為與一個人正常或原有的性格有鮮明的區別。本節目參賽者留在後臺,通過操控自己的虛擬人物在舞臺上進行表演來參加比賽。用“另一個我”來展現特色,他們的虛擬角色不僅在外形上比真人來得更誇張,而且在情感表達上也更加豐富。他們不僅可以流淚,還能向評委發射愛心和電眼光波。

更重要的是,他們每個人都不用用真實的面貌展示自己,有的人有舞臺恐懼,有的人有容貌焦慮,這些都不成問題了,許多天才選手將會通過這種方式展現自己的才華,很多參賽選手都在節目中打開心扉。

人形 外僑 生物 電影院 史詩 亭 視頻 在線 娛樂 屏幕 想像力 眼 美國 地球 海報 圖片 空間 媒體 數字 圖形 放鬆 男人 幻想 看 人 電影 電影 劇院 頭像 藝術 科學 相機 看 流行 行動 字符 藍色 促進 流 男性
圖片取自:(示意圖123rf)

Part2 有趣的靈魂

從外觀上難辨真假之餘,數字人面臨的更大考驗是交流起來能否有個有趣的靈魂。當下大火的AIGC能力雖然解決了底層內容創意生產的成本技術問題,但上升到數位人層面,AIGC尚無法實現靈魂最重要的一部分,一個人要有自己的特徵,再就是要有emotion,要有情感,千篇一律的不能叫做靈魂,能夠打動心靈的反而是資料無法體現的可能非常微小的情感。但這些在突飛猛進的技術演算法能力之下,很多數位人已經做得很好了。

比如宋韻文化代言人,谷小雨,通過最先進的數位科技,小雨擔任德壽宮遺址博物館AI虛擬導覽員,能夠和大家對話互動,暢聊德壽宮的歷史文化,傳頌經典宋詞,還能指引展廳內的路線導覽等等。

小雨首先需要捕捉到遊客的語音,通過深度學習、自然語言理解等技術,疊加騰訊遊戲語音GVoice 和微信智聆語音兩大技術團隊提供的語音辨識技術,她便能聽懂遊客的意圖並進行回復。即使是遊客的超綱問題,她也能對答入流,因為她已經進行了超過400G開放資料和30億參數量的超大語言模型訓練。

這只是語言訓練方面,還有表情和動作、個性與風格。小雨韻律自然、情感豐富的高表現力背後是一套從語音到面部、端到端的高表現力AI合成和驅動技術鏈路,她在對大量情感語音資料進行反復學習後,基於自主研發的超大規模中文語音預訓練模型,能夠針對各種音色、歌唱、語氣詞等不同類型的音訊自動匹配相應的面部表情和口型,小雨生動的語音

也就在面部自然流露了出來。

而在剛才提到的虛擬歌手大賽中的虛擬數字人則更複雜,因為他們要在真實的舞臺環境中和真實的舞者、燈光、攝像互動,還會跟現場的觀眾互動,這需要更大的算力合成渲染。

選手們穿上動作捕捉服裝,採集詳細的動作資訊,賦予到虛擬人身上

面部細節特徵尤為重要 ,就像當初阿凡達電影裡面一樣,動作捕捉和面部識別技術相結合,讓選手們重塑自我,並展示他們獨特的表演風格。

注意看,選手們的“阿凡達”形象上,紋身是可以動的,還會流出真實的眼淚,添加了真實性和情感

Part3 虛擬數字人哪家強?

目前大陸內部評選出的業界最強虛擬數字人,是由中國信通院牽頭,依託國際電信聯盟ITU、中國通信標準化協會CCSA等國內外標準組織,聯合國內外專家頭部企業等制定的評選規則評定的,包括騰訊火山引擎、百度、科大訊飛、阿裡雲、華為等在內的18家企業參與測評。在信通院嚴格的評測篩選下,百度智能雲曦靈獲得唯一傑出級獎項。

從人像構建方面看,在曦靈上傳一張照片,就能分鐘級生成數位人。

還可以通過1,200個維度即時控制精細表情,讓你的數位人毛髮畢現。

在驅動方式與內容生成方面,曦靈在傳統的動捕和麵捕之外,還主打AI驅動和7種情緒切換控制,同時搭載smart語音大模型,使得語音辨識準確率達到98%,數字人口型合成準確率達到98.5%,讓數位人的逼真程度進一步加深。

再來看關鍵的交互,真實感是最大的考驗,一方面要看端到端耗時指標,曦靈打造的數字人,擁有自己的經驗和認知,能在極短時間內聽懂並回饋,並能回答得有趣有料,真正實現有趣的靈魂。

在傳媒領域,百度智慧雲曦靈為央視新聞打造的AI手語主播,在2022年冬奧會期間正式上崗,讓更多聽障人士享受科技帶來的便利。

同年兩會期間,百度智慧雲為央視網打造的數字人小c形象自然表達流利,為觀眾帶來虛實結合的全新直播體驗。

在金融領域,百度智慧雲聯手浦發銀行,打造的金融數位人落地,通過理財推薦、即時問答,24小時客服線上等場景應用,大幅提升了用戶體驗,推動浦發銀行持續智慧化轉型。

在文博領域,曦靈為中國文物交流中心,打造的首個文博虛擬宣推官文夭夭。

與國家大劇院攜手共創首個虛擬員工——art鵝,服務入場觀眾,提供講解導覽等服務。

在直播領域,百度推出的數位人直播平臺,不僅可實現數位人24小時純AI直播,還為商家降低30%以上的直播成本。

未來10年,隨著整個AI演算法的進步,晶片的反覆運算,整個製作效能還將得到更大的提升。未來可期的渲染和生成能力,不一定需要買晶片,通過雲計算的加持,通過AI能力的進一步進化,數位人的製作技術將變得更加簡單化、一體化和自動化。面向未來,真實世界和數位世界的邊界將愈發模糊,數字人也正成為未來虛擬與現實世界的交互介面之一。

怎麼樣,心動了沒有,趕快設計自己專屬的數位虛擬人吧!