Wav2Lip-HD预训练模型首个套装涵盖了人脸检测模型和语音驱动面部模型等关键组件。这些模型不仅能够精准地捕捉人脸特征,还能根据语音输入实时调整面部表情,进而实现数字人技术中的语音驱动面部合成和图像超分辨率处理。该套装的人脸检测模型具备高度准确性,而语音驱动面部模型能够根据语音信号推断面部表情,使得数字人技术呈现更加生动和逼真的体验。
Wav2Lip-HD预训练模型首个套装,包含面部检测及语音激励模型
文件列表
Wav2Lip-HD-01.zip
(预估有个9文件)
face_segmentation.pth
50.82MB
esrgan_yunying.pth
63.94MB
detection_Resnet50_Final.pth
104.43MB
RealESRGAN_x4plus.pth
63.94MB
net_g_67500.pth
63.82MB
pretrained.state
296.3MB
parsing_parsenet.pth
81.38MB
README.md
61B
s3fd.pth
85.68MB
暂无评论