CS598CXZ Project
CS598CXZ-项目这个项目有几个依赖项。您需要安装flask,以及pyLucene。首先,您需要生成数据的文件语料库,这是通过运行python文件file-corpus.py完成的。数据输入是来自Amazon SNAP数据集的数据文件。现在生成数据后,我们需要对文件进行索引。我们通过运行IndexFiles.py文件来做到这一点。提供文件语料库的本地路径和要保存索引的输出路径。最后我们可以使用run.py来运行我们的程序。
文件列表
CS598CXZ-Project-master.zip
(预估有个18文件)
CS598CXZ-Project-master
stop_words.txt
3KB
README.md
559B
pysrc
SearchFiles.py
3KB
ranker.py
401B
IndexFiles.py
4KB
inverted_index.py
1KB
k_means.py
7KB
filter_reviews.py
11KB
暂无评论