统计词频,和对文档进行分词处理,计算tf-idf值。