捕捉人声并将人声转化成MIDI的小工具 准确率80% 还算可以