文件内是经过多次筛选后的汉字 拼音信息,格式为汉字+声母+韵母+声调