将视频拆成帧,并将图像合成视频。根据给定的骨骼点数据在图像上画出骨架,可包括视频拆成的多帧(可以有缺失数据)