Yelp数据集挑战信息检索类项目。作为挑战的一部分,完成了两项任务。任务1:为Yelp数据集中的不同业务分配类别。任务2:使用Yelp数据集中的评论和提示推荐喜欢的菜肴和不喜欢的菜肴。作者:Bipra De、Nihar Khetan、Anand Sharma、Satvik Shetty。合作者:刘夏中教授。ILS Z 534学期项目 - 信息检索,印第安纳大学布卢明顿分校。项目细节描述及用法:

  1. CreateTrainingAndTestCollections.java - 从给定的Yelp数据集中读取数据并在MongoDB中创建两个集合(训练和测试)。

  2. generateIndex.java - 从MongoDB读取数据并创建训练和测试Lucene索引。

  3. FeatureSetExtractor - 提取特征集并用于模型训练。