Ta上传的资源 (0)

nltk入门.适合入门者。要先安装nltk. 单词的数量" ] }, { "cell_type":"markdown", "metadata":{}, "source":[ "分析一下text1,即小说,查找小说中的词monstrous" ] }, { "cell_type":"code", "e

基于关键词Jarccard距离的文本相似度计算"TF/IDF算法:主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很高的关键度。\n","\n","TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度