可以用来提取音乐中的人声,需要注意的是伴奏和音乐都要是wav格式和44100位