Java词频统计算法(使用单词树)

滨斌 71 0 TXT 2019-05-21 19:05:26

用Java实现的词频统计,代码。为了统计词汇出现频率,最简单直接的做法是另外建一个Map:key是单词,value是次数。将文章从头读到尾,读到一个单词就到Map里查一下,如果查到了则次数加一,没查到则往Map里一扔。这样做虽然代码写起来简单,但性能却非常差。首先查询Map的代价是O(logn),假设文章的字母数为m,则整个统计程序的时间复杂度为O(mlogn)不说,如果要拿高频词可能还需要对统计结果进行排序。即便对结构上进行优化性能仍然不高。

用户评论
请输入评论内容
评分:
Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

完全没有用、直接复制粘贴过来的。而且不能用。别人的博客地址。http://blog.csdn.net/chengyingzhilian/article/details/8197987

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

goog,可以解决我要解决的问题

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

程序可运行 东西好 值得研究

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

非常不错的算法,都用上了

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

很好,谢谢,理解起来容易多了

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

嗯 不错,受用了。私下里使用了。

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

程序比较绕,不过还是可以借鉴一下的。

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

东西还行,有一点参考价值。

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

程序不错,代码和叙述比较完整也比较清晰

Generic placeholder image 卡了网匿名网友 2019-05-21 19:05:26

这个应该从别人的博客转载过来的,不知道谁是原作者,而且十分有点黑,贴上博客链接http://blog.csdn.net/chengyingzhilian/article/details/8197987