加载Gutenberg语料库; 过滤停用词; 构建词袋模型:一篇文档是有其中的词构成的一个集合(袋子); 词频分析:NLTK中的FreqDist类可以将单词封装成字典。 分类器部分代码见《Python处理文本分类代码(二) 》下载资源