训练所采用的语料如下: 12G百度百科词条 20G小说 90G的其他爬虫语料 训练得到词库1.35G,bin和model格式