財聯(lián)社5月28日電,騰訊混元發(fā)布并開源的語音數(shù)字人模型HunyuanVideo-Avatar,由騰訊混元視頻大模型(HunyuanVideo)及騰訊音樂天琴實驗室MuseV技術(shù)聯(lián)合研發(fā),支持頭肩、半身與全身景別,以及多風(fēng)格、多物種與雙人場景,面向視頻創(chuàng)作者提供高一致性、高動態(tài)性的視頻生成能力。用戶可上傳人物圖像與音頻,HunyuanVideo-Avatar模型會自動理解圖片與音頻,比如人物所在環(huán)境、音頻所蘊含的情感等,讓圖中人物自然地說話或唱歌,生成包含自然表情、唇形同步及全身動作的視頻。