1998人民日报切分语料,在中文统计分词中可用来训练N-gram模型