在进行文本分类前,我们需要对语料库中文本数据进行预处理,它对后续的文本分类