基于文本實(shí)時(shí)生成元宇宙人物的語(yǔ)音和三維動(dòng)畫技術(shù)(TTSA)
使用業(yè)界先進(jìn)的深度學(xué)習(xí)技術(shù),基于文本實(shí)時(shí)自動(dòng)生成高質(zhì)量的元宇宙人物的語(yǔ)音和動(dòng)畫數(shù)據(jù),實(shí)現(xiàn)了從簡(jiǎn)單的語(yǔ)音助手到有形象可交互的元宇宙數(shù)字助手的轉(zhuǎn)變,可以讓客戶用最自然的方式和元宇宙人物進(jìn)行對(duì)話。
基于真人語(yǔ)音輸入實(shí)時(shí)生成元宇宙人物三維動(dòng)畫技術(shù)(STA)
通過天潤(rùn)智力的語(yǔ)音合成動(dòng)畫(Speech To Animation)技術(shù),可以驅(qū)動(dòng)元宇宙人物實(shí)時(shí)合成嘴型動(dòng)畫、面部表情、肢體動(dòng)作等,且合成的內(nèi)容和語(yǔ)音信息高度的匹配,使元宇宙數(shù)字人可以像真人一樣生動(dòng)逼真,表現(xiàn)自然流暢。
有感情的語(yǔ)音合成(ETTS)
ETTS(emotional text to speech)是有感情的tts(語(yǔ)音合成),一般的tts是比較機(jī)械化,etts則是在tts過程中,保留類似真人的音調(diào)和韻律,聽起來更有感情。
對(duì)話系統(tǒng)(NLP)
對(duì)用戶的問題進(jìn)行處理,理解用戶的語(yǔ)義、意圖,再進(jìn)行匹配生成對(duì)應(yīng)的回復(fù)。
智能動(dòng)作生成
在TTSA或者STA中使用,理解語(yǔ)義,然后根據(jù)語(yǔ)義匹配或者實(shí)時(shí)生成對(duì)應(yīng)的動(dòng)作和表情
音色轉(zhuǎn)換技術(shù)(VC)
基于語(yǔ)音的音色轉(zhuǎn)換技術(shù),將初始音色的聲音通過天潤(rùn)智力自研的VC算法可實(shí)時(shí)轉(zhuǎn)換成目標(biāo)音色的音頻進(jìn)行輸出。