下面是《三国演义》人物数量统计代码的升级版,升级版中对于某些确定不是人名的词,即使做了词频统计,也要将它删除掉。使用寄一个集合excludes来接收一些确定不是人名但是又排序比较靠前的单词列进去。运行结果:可以看出还是有像“商议”、“如何”等不是人物的词出现在统计结果,我们将这些词加入到 excludes 中,多次运行程序后最后得到《三国演义》任务出场顺序前20:七、文本词频统计问题举一反三应用问题扩展

python jieba库的基本使用

python jieba库的基本使用

python jieba库的基本使用

python jieba库的基本使用

python jieba库的基本使用