向量模型 中文分词
信息检索的经典模型认为,每篇文献可以用一组有代表性的关键词即标引词集合来描述。标引词是文献中的词,其语义可以帮助理解文献的主题;因此,标引词常用于编制索引和概括文献的内容。用来描述文献内容的标引词应该是与文献内容密切相关的语词,我们可以为文献中的标引词定义一个权值(weight)来描述这种相关程度。 标引词加权原理和算法并编程实现
文件列表
向量模型中文分词.rar
(预估有个27文件)
向量模型终极完美注释版
向量模型.cpp
4KB
向量模型.opt
48KB
向量模型.ncb
57KB
test
b.txt
154B
5.txt
3KB
c.txt
158B
a.txt
146B
e.txt
144B
暂无评论