python的思维就是让我们用尽可能少的代码来解决问题。之所以单独谈到统计词频这个问题,是因为它在统计和数据挖掘方面经常会用到,尤其是处理分类问题上。故在此做个简单的记录。统计的材料如下:直接使用dict来进行统计更优雅的实现方式使用defalutdict来实现使用CounterCounter既然是一个计数器,那么它本身也就具有很多统计的方法。例如,最常见的词频统计的排序,可以获得前n个最高的词频。显然,使用defalutdict和Counter代码最简洁,更能符合python开发之道。

python利用多种方式来统计词频(单词个数)

python利用多种方式来统计词频(单词个数)