基于最大匹配的正向分词和反向分词。通过与训练语料库中进行比对,来对指定文本文件进行分词。训练语料库是人民日报1998年1月的文章,训练语料库是已经分好词的