本课题所研究的内容是某美食类网站关于图片,内容的处理以及垂直搜索的问题。对于图片处理,简单来说是图片的匹配,采用匹配算法过滤出重复的图片然后根据匹配数据采取不同的操作。该问题通过建立数据库存储原来的图片信息,使用颜色直方图生成算法生成对应的颜色直方图并用距离向量算法计算图片的相似度数据来实现。内容处理问题即点评处理,该问题与图片处理类似,通过中文分词算法对点评内容进行分词,然后根据规则对待匹配的内容进行排序,最后进行匹配操作计算匹配度。垂直搜索问题即针对美食类的信息进行专项搜索,该问题通过建立源数据的倒排索引树,检索索引并对结果进行排序的方式来实现。结果排序可分为热度排序和按字