本文讨论了基于词典分词和基于n一gram信息提取的两利,中文文本特征获取方法,提出了将两者相结合的方法,为分类系统提供更多类型的文本特证,从而达到提高分类性能的目的;并进一步研究了冗余特征对于文本分类系统的影响.