Python中的信息检索InfoR是用于的Python包。信息检索意味着给定一组(text/html/xml)文档,提取与搜索查询最相关的文档。您的搜索引擎(例如Google)是一个检索系统。 InfoR支持3种类型的检索系统:向量空间模型语言模型概率模型有关这些模型的更多信息(无双关语!),请参阅Google使用PageRank算法来利用html文档中的超链接。此包目前仅适用于文本文档的语料库。我还希望添加html/xml支持,并希望包含PageRank的实现。下载: :安装: pip install info依赖项:文档: :用法: from InfoR.VectorSpaceModels import VSM, LanguageModel, ProbModel vector space mode out